304 Ruostumattomasta teräksestä hitsattu kierreputki / letku kemiallinen zomponentti, maailmanlaajuisen meren mikrobiomin biosynteettinen potentiaali

Kiitos vierailustasi Nature.comissa.Käytät selainversiota, jossa on rajoitettu CSS-tuki.Parhaan kokemuksen saamiseksi suosittelemme käyttämään päivitettyä selainta (tai poistamaan Yhteensopivuustila käytöstä Internet Explorerissa).Lisäksi jatkuvan tuen varmistamiseksi näytämme sivuston ilman tyylejä ja JavaScriptiä.
Liukusäätimet, joissa näkyy kolme artikkelia per dia.Käytä Takaisin- ja Seuraava-painikkeita liikkuaksesi diojen välillä tai diaohjaimen painikkeita lopussa.

Yksityiskohtainen tuotekuvaus

304 Ruostumattomasta teräksestä hitsattu kierreputki/letku
1. Tekniset tiedot: Ruostumattomasta teräksestä valmistettu kelaputki / letku
2. Tyyppi: hitsattu tai saumaton
3. Standardi: ASTM A269, ASTM A249
4. Ruostumattomasta teräksestä valmistetun kelaputken ulkohalkaisija: 6–25,4 mm
5. Pituus: 600-3500MM tai asiakkaan vaatimuksen mukaan.
6. Seinämän paksuus: 0,2-2,0 mm.

7. Toleranssi: OD: +/-0,01 mm;Paksuus: +/-0,01 %.

8. Kelan sisäreiän koko: 500-1500 mm (voidaan säätää asiakkaan vaatimusten mukaan)

9. Kelan korkeus: 200-400 mm (voidaan säätää asiakkaan vaatimusten mukaan)

10. Pinta: Kirkas tai hehkutettu
11. Materiaali: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, metalliseos 625, 825, 2205, 2507 jne.
12. Pakkaus: kudotut pussit puukotelossa, puinen lava, puinen akseli tai asiakkaan vaatimuksen mukaan
13. Testi: kemiallinen komponentti, myötöraja, vetolujuus, kovuuden mittaus
14. Takuu: Kolmannen osapuolen (esimerkiksi :SGS TV ) tarkastus jne.
15. Sovellus: Sisustus, huonekalut, öljynkuljetus, lämmönvaihdin, kaiteiden valmistus, paperinvalmistus, auto, elintarviketeollisuus, lääketiede jne.

Kaikki ruostumattoman teräksen kemiallinen koostumus ja fyysiset ominaisuudet alla:

Materiaali ASTM A269 Kemiallinen koostumus % Max
C Mn P S Si Cr Ni Mo HUOM Nb Ti
TP304 0,08 2.00 0,045 0,030 1.00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2.00 0,045 0,030 1.00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2.00 0,045 0,030 1.00 16,0-18,0 10,0-14,0 2.00-3.00 ^ ^ ^
TP316L 0,035 D 2.00 0,045 0,030 1.00 16,0-18,0 10,0-15,0 2.00-3.00 ^ ^ ^
TP321 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2.00 0,045 0,030 1.00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

Materiaali Lämpökäsittely Lämpötila F (C) Min. Kovuus
Brinell Rockwell
TP304 Ratkaisu 1900 (1040) 192HBW/200HV 90 HRB
TP304L Ratkaisu 1900 (1040) 192HBW/200HV 90 HRB
TP316 Ratkaisu 1900 (1040) 192HBW/200HV 90 HRB
TP316L Ratkaisu 1900 (1040) 192HBW/200HV 90 HRB
TP321 Ratkaisu 1900(1040) F 192HBW/200HV 90 HRB
TP347 Ratkaisu 1900 (1040) 192HBW/200HV 90 HRB

 

OD, tuumaa OD-toleranssi tuuma (mm) WT-toleranssi % Pituustoleranssi tuuma (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13 ) ± 15 1/8 ( 3.2 ) 0
> 1/2 ~ 1 1/2 ± 0,005(0,13) ± 10 1/8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010(0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015(0,38) ± 10 3/16 (4,8) 0
> 5 1/2 ~< 8 ± 0,030(0,76) ± 10 3/16 (4,8) 0
8~< 12 ± 0,040(1,01) ± 10 3/16 (4,8) 0
12 ~ < 14 ± 0,050(1,26) ± 10 3/16 (4,8) 0

Luonnolliset mikrobiyhteisöt ovat fylogeneettisesti ja metabolisesti monimuotoisia.Alitutkittujen organismiryhmien1 lisäksi tällä monimuotoisuudella on myös runsaasti mahdollisuuksia ekologisesti ja bioteknisesti merkittävien entsyymien ja biokemiallisten yhdisteiden löytämiseen2,3.Tämän monimuotoisuuden tutkiminen sellaisten genomisten polkujen määrittämiseksi, jotka syntetisoivat tällaisia ​​yhdisteitä ja sitovat niitä vastaaviin isäntiinsä, on kuitenkin edelleen haaste.Mikro-organismien biosynteettinen potentiaali avomerellä on suurelta osin tuntematon johtuen rajoituksista koko genomin resoluutiotietojen analysoinnissa globaalissa mittakaavassa.Täällä tutkimme valtameren biosynteettisten geeniklustereiden monimuotoisuutta ja monimuotoisuutta integroimalla noin 10 000 mikrobigenomia viljellyistä soluista ja yksittäisistä soluista yli 25 000 äskettäin rekonstruoidun genomin kanssa yli 1 000 merivesinäytteestä.Näillä ponnisteluilla on tunnistettu noin 40 000 oletettua enimmäkseen uutta biosynteettistä geeniklusteria, joista osa on löydetty aiemmin epäillyistä fylogeneettisistä ryhmistä.Näissä populaatioissa tunnistimme biosynteettisillä geeniklustereilla rikastetun linjan ("Candidatus Eudormicrobiaceae"), joka kuului viljelemättömään bakteeriperään ja sisälsi joitain tämän ympäristön biosynteettisesti monimuotoisimpia mikro-organismeja.Näistä olemme karakterisoineet fosfataasi-peptidi- ja pytonamidireitit tunnistamalla tapauksia epätavallisesta bioaktiivisen yhdisteen rakenteesta ja entsymologiasta, vastaavasti.Yhteenvetona voidaan todeta, että tämä tutkimus osoittaa, kuinka mikrobiomipohjaiset strategiat voivat mahdollistaa aiemmin kuvaamattomien entsyymien ja luonnollisten elintarvikkeiden tutkimisen huonosti ymmärretyssä mikrobiotassa ja ympäristössä.
Mikrobit ohjaavat globaaleja biogeokemiallisia kiertokulkuja, ylläpitävät ravintoverkkoja ja pitävät kasvit ja eläimet terveinä5.Niiden valtava fylogeneettinen, metabolinen ja toiminnallinen monimuotoisuus tarjoaa runsaasti mahdollisuuksia uusien taksonien1, entsyymien ja biokemiallisten yhdisteiden, mukaan lukien luonnontuotteiden6, löytämiseen.Ekologisissa yhteisöissä nämä molekyylit tarjoavat mikro-organismeille erilaisia ​​fysiologisia ja ekologisia toimintoja kommunikaatiosta kilpailuun 2, 7 .Alkuperäisten toimintojensa lisäksi nämä luonnontuotteet ja niiden geneettisesti koodatut tuotantoreitit tarjoavat esimerkkejä bioteknologisista ja terapeuttisista sovelluksista2,3.Tällaisten reittien ja yhteyksien tunnistamista on helpottanut suuresti viljeltyjen mikrobien tutkimus.Luonnonympäristöjen taksonomiset tutkimukset ovat kuitenkin osoittaneet, että suurinta osaa mikro-organismeista ei ole viljelty8.Tämä kulttuurinen harha rajoittaa kykyämme hyödyntää monien mikrobien koodaamaa toiminnallista monimuotoisuutta4,9.
Näiden rajoitusten voittamiseksi viime vuosikymmenen aikana saavutettu teknologinen kehitys on mahdollistanut tutkijoiden sekvensoinnin suoraan (eli ilman aikaisempaa viljelyä) mikrobien DNA-fragmentteja kokonaisista yhteisöistä (metagenomiikka) tai yksittäisistä soluista.Kyky koota nämä fragmentit suuremmiksi genomifragmenteiksi ja rekonstruoida useita metagenomisesti koottuja genomeja (MAG) tai yksittäisiä monistettuja genomeja (SAG, vastaavasti), avaa tärkeän mahdollisuuden mikrobiomin (eli mikrobiyhteisöjen ja mikrobiomin) taksosentrisille tutkimuksille.tasoittaa uusia polkuja.oma geneettinen materiaali tietyssä ympäristössä) 10,11,12.Viimeaikaiset tutkimukset ovat todellakin laajentaneet suuresti mikrobien monimuotoisuuden fylogeneettistä esitystä Maan päällä1, 13 ja ovat paljastaneet suuren osan toiminnallisesta monimuotoisuudesta yksittäisissä mikrobiyhteisöissä, joita viljellyt mikro-organismien referenssigenomisekvenssit (REF) eivät aiemmin kattaneet14.Kyky sijoittaa tuntematon toiminnallinen monimuotoisuus isäntägenomin kontekstiin (eli genomin erottelukyky) on kriittinen ennustettaessa vielä karakterisoimattomia mikrobilinjoja, jotka oletettavasti koodaavat uusia luonnontuotteita15,16 tai jäljitettäessä tällaisten yhdisteiden alkuperäistä tuottajaa17.Esimerkiksi yhdistetty metagenominen ja yksisoluinen genominen analyysi lähestymistapa on johtanut Candidatus Entotheonellan, aineenvaihdunnallisesti rikkaiden bakteerien ryhmän tunnistamiseen erilaisten lääkepotentiaalien tuottajiksi18.Huolimatta viimeaikaisista yrityksistä tutkia erilaisia ​​mikrobiyhteisöjä16,19, yli kaksi kolmasosaa maapallon suurimman ekosysteemien valtameren16,20 globaaleista metagenomisista tiedoista puuttuu edelleen.Näin ollen yleisesti ottaen meren mikrobiomin biosynteettinen potentiaali ja sen mahdollisuudet uusien entsymaattisten ja luonnontuotteiden varastona ovat edelleen suurelta osin alitutkittuja.
Tutkiaksemme meren mikrobiomien biosynteettistä potentiaalia globaalissa mittakaavassa yhdistimme ensin meren mikrobigenomit, jotka on saatu käyttämällä kulttuuririippuvaisia ​​ja ei-kulttuurimenetelmiä, luodaksemme laajan tietokannan fylogenetiikasta ja geenitoiminnasta.Tämän tietokannan tutkiminen paljasti laajan valikoiman biosynteettisiä geeniklustereita (BGC), joista suurin osa kuuluu vielä karakterisoimattomiin geeniklusteriperheisiin (GCF).Lisäksi tunnistimme tuntemattoman bakteeriperheen, jolla on tähän mennessä suurin tunnettu BGC:iden monimuotoisuus avomerellä.Valitsimme kaksi ribosomaalista synteesi- ja post-translationaalisesti modifioitua peptidireittiä (RiPP) kokeelliseen validointiin perustuen niiden geneettisiin eroihin tällä hetkellä tunnetuista reiteistä.Näiden reittien toiminnallinen karakterisointi on paljastanut odottamattomia esimerkkejä entsymologiasta sekä rakenteellisesti epätavallisia yhdisteitä, joilla on proteaasia estävää aktiivisuutta.
Aluksi pyrimme luomaan globaalin tietoresurssin genomianalyysiin keskittyen sen bakteeri- ja arkeologisiin komponentteihin.Tätä tarkoitusta varten yhdistimme metagenomiset tiedot ja 1038 merivesinäytettä 215 maailmanlaajuisesti jakautuneelta näytteenottopaikalta (leveysaste = 141,6°) ja useista syvistä kerroksista (1–5600 metrin syvyydessä, jotka kattavat pelagiset, mesopelagiset ja syvyysalueet).Tausta 21, 22, 23 (kuva 1a, laajennetut tiedot, kuva 1a ja lisätaulukko 1).Laajan maantieteellisen kattavuuden lisäksi nämä valikoivasti suodatetut näytteet antoivat meille mahdollisuuden verrata meren mikrobiomin eri komponentteja, mukaan lukien virusrikas (<0,2 µm), prokaryoottirikas (0,2–3 µm), hiukkasrikas (0,8 µm). ).–20 µm) ja viruksettomia (>0,2 µm) pesäkkeitä.
a, Yhteensä 1038 julkisesti saatavilla olevaa meren mikrobiyhteisöjen genomia (metagenomiikka) kerättynä 215 maailmanlaajuisesti jakautuneesta paikasta (62°S - 79°N ja 179°W - 179°E).Karttalaatat © Esri.Lähteet: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ ja Esri.b, näitä metagenomeja käytettiin rekonstruoimaan MAG:t (menetelmät ja lisätiedot), jotka eroavat määrältään ja laadultaan (menetelmät) tietoaineistoissa (merkitty värillä).Rekonstruoituja MAG:ita täydennettiin julkisesti saatavilla olevilla (ulkoisilla) genomeilla, mukaan lukien käsintehdyt MAG26, SAG27 ja REF.27 Käännä OMD.c, verrattuna aikaisempiin raportteihin, jotka perustuivat vain SAG (GORG)20:een tai MAG (GEM)16:een, OMD parantaa meren mikrobiyhteisöjen genomista karakterisointia (metagenominen lukukartoitusnopeus; menetelmä) kahdesta kolmeen kertaan johdonmukaisemmalla syvyys- ja leveysaste..<0,2, n = 151, 0,2 - 0,8, n = 67, 0,2 - 3, n = 180, 0,8 - 20, n = 30, > 0,2, n = 610, <30°, n = 132, 30 - 60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, OMD-ryhmittely lajiklusteritasolle (95 %:n keskimääräinen nukleotidi-identiteetti) tunnistaa yhteensä noin 8 300 lajia, joista yli puolta ei ole aiemmin karakterisoitu taksonomisten merkintöjen mukaan käyttämällä GTDB:tä (versio 89) e, lajien luokittelu genomityypin mukaan osoitti, että MAG, SAG ja REF täydentävät toisiaan hyvin heijastaen fylogeneettistä monimuotoisuutta. meren mikrobiomi.Erityisesti 55 %, 26 % ja 11 % lajeista olivat spesifisiä MAG:lle, SAG:lle ja REF:lle.BATS, Bermuda Atlantic Time Series;GEM, maapallon mikrobiomin genomit;GORG, globaali valtameren referenssigenomi;HOT, Havaijin valtameren aikasarja.
Tämän aineiston avulla rekonstruoimme yhteensä 26 293 MAG:ta, enimmäkseen bakteeri- ja arkeaalisia (kuva 1b ja laajennetut tiedot, kuva 1b).Loimme nämä MAG:t kokoonpanoista erillisistä metagenomisista näytteistä, emmekä yhdistetyistä metagenomista näytteistä, jotta estetään luonnollisen sekvenssivaihtelun romahtaminen eri paikoista tai aikapisteistä (menetelmistä) otettujen näytteiden välillä.Lisäksi ryhmitimme genomiset fragmentit niiden esiintyvyyskorrelaatioiden perusteella suuressa määrässä näytteitä (58 - 610 näytteestä riippuen tutkimuksesta; menetelmä).Huomasimme, että tämä on aikaa vievä mutta tärkeä vaihe24, joka jätettiin väliin useissa suurissa MAG16, 19, 25 jälleenrakennustöissä ja parantaa merkittävästi rakennusten määrää (2,7-kertaisesti) ja laatua (keskimäärin +20 %). perimä.rekonstruoitu täällä tutkitusta meren metagenomista (laajennettu data, kuva 2a ja lisätiedot).Kaiken kaikkiaan nämä ponnistelut johtivat 4,5-kertaiseen lisääntymiseen meren mikrobien MAG:issa (6-kertaiseksi, jos vain laadukkaat MAG:t otetaan huomioon) verrattuna kattavimpaan nykyään saatavilla olevaan MAG-resurssiin16 (Menetelmät).Tämä äskettäin luotu MAG-setti yhdistettiin sitten 830:een käsin poimituun MAG26:een, 5969 SAG27:ään ja 1707 REF:ään.27 meren bakteeri- ja arkkilajia muodostivat 34 799 genomin kombinatorisen kokoelman (kuva 1b).
Tämän jälkeen arvioimme äskettäin luotua resurssia parantaaksemme sen kykyä edustaa meren mikrobiyhteisöjä ja arvioida eri genomityyppien integroinnin vaikutuksia.Keskimäärin havaitsimme, että se kattaa noin 40–60 % meren metagenomisista tiedoista (kuva 1c), mikä on kaksi tai kolme kertaa enemmän kuin aikaisemmat MAG-raportit sekä syvyydessä että leveysasteella. More serial 16 tai SAG20.Lisäksi systemaattisesti mitataksemme taksonomista monimuotoisuutta vakiintuneissa kokoelmissa merkitsimme kaikki genomit käyttämällä Genome Taxonomy Database (GTDB) -työkalupakkia (menetelmiä) ja käytimme keskimääräistä genominlaajuista nukleotidi-identiteettiä 95%.28 tunnistaa 8304 lajiklusteria (laji).Kaksi kolmasosaa näistä lajeista (mukaan lukien uudet kladit) ei ollut aiemmin esiintynyt GTDB:ssä, joista 2790 löydettiin käyttämällä tässä tutkimuksessa rekonstruoitua MAG:ta (kuva 1d).Lisäksi havaitsimme, että erityyppiset genomit ovat erittäin täydentäviä: 55 %, 26 % ja 11 % lajeista koostuvat kokonaan MAG:sta, SAG:sta ja REF:stä, vastaavasti (kuva 1e).Lisäksi MAG kattoi kaikki 49 vesipatsaasta löydettyä tyyppiä, kun taas SAG ja REF edustivat vain 18 ja 11 niistä.SAG edustaa kuitenkin paremmin yleisimpien kladien monimuotoisuutta (laajennetut tiedot, kuva 3a), kuten Pelagic Bacteriales (SAR11), jossa SAG kattaa lähes 1300 lajia ja MAG vain 390 lajia.Erityisesti REF:t menivät harvoin päällekkäin MAG:iden tai SAG:ien kanssa lajitasolla ja edustivat yli 95 % niistä noin 1000 genomista, joita ei löytynyt täällä tutkituista avomeren metagenomisista ryhmistä, mikä johtui pääasiassa vuorovaikutuksista muun tyyppisten eristettyjen edustavien merinäytteiden (esim. sedimenttien) kanssa. .tai isäntä-kumppani).Jotta se olisi laajalti tiedeyhteisön saatavilla, tätä meren genomiresurssia, joka sisältää myös luokittelemattomia fragmentteja (esim. ennustetuista faageista, genomisaarista ja genomifragmenteista, joista ei ole riittävästi tietoa MAG-rekonstruktioon), voidaan verrata taksonomisiin tietoihin. .Käytä huomautuksia sekä geenitoimintoja ja kontekstuaalisia parametreja Ocean Microbiology Databasessa (OMD; https://microbiomics.io/ocean/).
Sitten ryhdyimme tutkimaan biosynteettisen potentiaalin rikkautta ja uutuutta avomeren mikrobiomeissa.Tätä tarkoitusta varten käytimme ensin antiSMASH:ia kaikille MAG:ille, SAG:ille ja REF:ille, jotka löydettiin 1038 meren metagenomista (menetelmistä) yhteensä 39 055 BGC:n ennustamiseksi.Sitten ryhmittelimme nämä 6907 ei-redundanttiin GCF:ään ja 151 geeniklusteripopulaatioon (GCC; täydentävä taulukko 2 ja menetelmät) ottaaksemme huomioon luontaisen redundanssin (eli sama BGC voidaan koodata useisiin genomeihin) ja metagenomista dataa. Konsentroitujen BGC:iden fragmentointi.Epätäydelliset BGC:t eivät merkittävästi lisänneet, jos ollenkaan (lisätiedot), GCF:iden ja vastaavasti GCC:iden määrää, jotka sisälsivät vähintään yhden ehjän BGC-jäsenen 44 prosentissa ja 86 prosentissa tapauksista.
GCC-tasolla löysimme laajan valikoiman ennustettuja RiPP:itä ja muita luonnontuotteita (kuva 2a).Niiden joukossa esimerkiksi aryylipolyeenit, karotenoidit, ektoiinit ja sideroforit kuuluvat GCC:ihin, joilla on laaja fylogeneettinen levinneisyys ja suuri määrä valtamerten metagenomeja, mikä voi viitata mikro-organismien laajaan sopeutumiseen meriympäristöön, mukaan lukien vastustuskyky reaktiivisille happilajeille, oksidatiivinen ja osmoottinen stressi..tai raudan imeytyminen (lisätietoja).Tämä toiminnallinen monimuotoisuus eroaa äskettäin tehdystä noin 1,2 miljoonan BGC:n analyysistä noin 190 000 genomin joukossa, jotka on tallennettu NCBI RefSeq -tietokantaan (BiG-FAM/RefSeq, jäljempänä RefSeq)29, joka osoitti, että ei-ribosomaaliset syntetaasi- ja polyketidisyntetaasipeptidit (NRPS) (PKS) BGC:t (lisätiedot).Löysimme myös 44 (29 %) GCC:tä, jotka liittyvät vain etäisesti mihin tahansa RefSeq BGC:hen (\(\bar{d}\)RefSeq > 0,4; kuva 2a ja menetelmät) ja 53 (35 %) GCC:tä vain MAG:sta, mikä korostaa potentiaalia havaita aiemmin kuvaamattomia kemikaaleja OMD:ssä.Koska jokainen näistä GCC:istä edustaa todennäköisesti erittäin erilaisia ​​biosynteettisiä toimintoja, analysoimme edelleen tietoja GCF-tasolla pyrkiessämme tarjoamaan yksityiskohtaisemman ryhmittelyn BGC:istä, joiden ennustetaan koodaavan samanlaisia ​​luonnontuotteita29.Yhteensä 3861 (56 %) tunnistettua GCF:ää ei ollut päällekkäinen RefSeqin kanssa, ja > 97 % GCF:istä ei ollut läsnä MIBiG:ssä, joka on yksi suurimmista kokeellisesti validoitujen BGC:iden tietokannoista (kuva 2b).Vaikka ei olekaan yllättävää löytää monia mahdollisia uusia polkuja ympäristöissä, joita referenssigenomi ei edusta hyvin, menetelmämme BGC:iden replikoimiseksi GCF:iksi ennen vertailua eroaa aiemmista raporteista 16 ja antaa meille mahdollisuuden antaa puolueettoman arvion uutuudesta.Suurin osa uudesta monimuotoisuudesta (3012 GCF tai 78 %) vastaa ennustettuja terpeenejä, RiPP:tä tai muita luonnontuotteita, ja suurin osa (1815 GCF tai 47 %) on koodattu tuntemattomiin tyyppeihin niiden biosynteettisen potentiaalin vuoksi.Toisin kuin PKS- ja NRPS-klusterit, nämä kompaktit BGC:t eivät todennäköisesti hajoa metagenomisen kokoonpanon 31 aikana ja mahdollistavat enemmän aikaa ja resursseja vaativan tuotteidensa toiminnallisen karakterisoinnin.
Yhteensä 39 055 BGC:tä ryhmiteltiin 6 907 GCF:ään ja 151 GCC:hen.a, tietojen esitys (sisäinen ulkoinen).BGC-etäisyyksien hierarkkinen klusterointi GCC:hen perustuen, joista 53 on vain MAG:n vahvistamia.GCC sisältää BGC:t eri taksoneista (ln-transformoitu porttitaajuus) ja eri BGC-luokista (ympyrän koko vastaa sen taajuutta).Kunkin GCC:n ulompi kerros edustaa BGC:iden määrää, esiintyvyyttä (näytteiden prosenttiosuutta) ja etäisyyttä (minimi BGC:n kosinietäisyys (min(dMIBiG))) BiG-FAM:sta BGC:hen.GCC:t, joiden BGC:t liittyvät läheisesti kokeellisesti varmennettuihin BGC:ihin (MIBiG), on korostettu nuolilla.b Verrattaessa GCF:ää ennustettuihin (BiG-FAM) ja kokeellisesti validoituihin (MIBiG) BGC:ihin, löydettiin 3861 uutta (d–>0,2) GCF:ää.Suurin osa (78 %) näistä koodaa RiPP:tä, terpeenejä ja muita oletettuja luonnontuotteita.c, kaikki 1038 meren metagenomista löydetyt OMD:n genomit sijoitettiin GTDB-peruspuuhun OMD:n fylogeneettisen kattavuuden osoittamiseksi.Kladit, joissa ei ole genomeja OMD:ssä, näkyvät harmaina.BGC:iden lukumäärä vastaa suurinta ennustettua BGC:iden määrää genomia kohti tietyssä klaadissa.Selvyyden vuoksi viimeiset 15 % solmuista on tiivistetty.Nuolet osoittavat runsaasti BGC:tä (> 15 BGC) sisältäviä kladeja, lukuun ottamatta Mycobacterium, Gordonia (toinen vain Rhodococcus) ja Crocosphaera (toinen vain Synechococcus).d, Tuntematon c.Eremiobacterota osoitti suurinta biosynteettistä monimuotoisuutta (luonnontuotetyyppiin perustuva Shannon-indeksi).Jokainen vyöhyke edustaa genomia, jossa on eniten BGC:itä lajissa.T1PKS, PKS tyyppi I, T2/3PKS, PKS tyyppi II ja tyyppi III.
Rikkauden ja uutuuden lisäksi tutkimme meren mikrobiomin biosynteettisen potentiaalin biomaantieteellistä rakennetta.Näytteiden ryhmittely keskimääräisen metagenomisen GCF-kopiolukujakauman mukaan (menetelmät) osoitti, että alhaisilla leveysasteilla, pinnalla, prokaryoottirikkaissa ja virusköyhissä yhteisöissä, jotka olivat peräisin enimmäkseen pinta- tai syvemmistä auringon valaisemista vesistä, oli runsaasti RiPP- ja BGC-terpeenejä.Sitä vastoin polaariset, syvänmeren, virus- ja hiukkasrikkaat yhteisöt yhdistettiin NRPS:n ja PKS:n BGC:n suurempiin määriin (laajennetut tiedot, kuva 4 ja lisätiedot).Lopuksi havaitsimme, että hyvin tutkitut trooppiset ja pelagiset yhteisöt ovat lupaavimpia uusien terpeenien lähteitä (lisättyjen tietojen kuva).Suurin potentiaali PKS:lle, RiPP:lle ja muille luonnontuotteille (kuva 5a laajennetuilla tiedoilla).
Täydentääksemme tutkimustamme meren mikrobiomien biosynteettisestä potentiaalista pyrimme kartoittamaan niiden fylogeneettisen jakautumisen ja tunnistamaan uusia BGC-rikastettuja kladeja.Tätä tarkoitusta varten sijoitimme merimikrobien genomit normalisoituun GTDB13-bakteeri- ja arkeologiseen fylogeneettiseen puuhun ja peitimme niiden koodaamat oletetut biosynteesireitit (kuva 2c).Olemme helposti havainneet useita BGC-rikastettuja kladeja (jota edustaa yli 15 BGC:tä) merivesinäytteistä (menetelmistä), jotka tunnetaan biosynteettisestä potentiaalistaan, kuten syanobakteerit (Synechococcus) ja Proteus-bakteerit, kuten Tistrella32,33, tai äskettäin herättäneet huomiota niiden vuoksi. luonnontuotteet.kuten Myxococcota (Sandaracinaceae), Rhodococcus ja Planctomycetota34,35,36.Mielenkiintoista on, että näissä kladeissa löysimme useita aiemmin tutkimattomia sukulinjoja.Esimerkiksi ne lajit, joilla on rikkain biosynteettinen potentiaali phyla Planctomycetota ja Myxococcota, kuuluivat karakterisoimattomiin ehdokaslajeihin ja suvuihin, vastaavasti (lisätaulukko 3).Kaiken kaikkiaan tämä viittaa siihen, että OMD tarjoaa pääsyn aiemmin tuntemattomiin fylogeneettisiin tietoihin, mukaan lukien mikro-organismit, jotka voivat edustaa uusia kohteita entsyymien ja luonnontuotteiden löytämiselle.
Seuraavaksi luonnehdimme BGC-rikastettua kladea laskemalla sen jäsenten koodaamien BGC:iden maksimimäärän, vaan myös arvioimalla näiden BGC:iden monimuotoisuuden, mikä selittää erityyppisten luonnollisten ehdokastuotteiden esiintymistiheyden (kuva 2c ja menetelmät). )..Huomasimme, että tässä tutkimuksessa biosynteettisesti monipuolisimmat lajit edustivat erityisesti muokatut bakteeri-MAG:t.Nämä bakteerit kuuluvat viljelemättömään Candidatus Eremiobacterota -suvun, joka on suurelta osin tutkimatta muutamaa genomitutkimusta lukuun ottamatta37,38.On huomionarvoista, että "n.Eremiobacterota-sukua on analysoitu vain maanpäällisessä ympäristössä39, eikä sen tiedetä sisältävän BGC:ssä rikastuneita jäseniä.Tässä olemme rekonstruoineet kahdeksan saman lajin MAG:ta (nukleotidi-identiteetti > 99 %) 23. Siksi ehdotamme lajinimeä "Candidatus Eudoremicrobium malaspinii", joka on nimetty nereidin (merinymfi) mukaan, kaunis lahja kreikkalaisessa mytologiassa ja tutkimusmatkoissa.'Ka.Fylogeneettisen huomautuksen 13 mukaan E. malaspiniilla ei ole aiemmin tunnettuja sukulaisia ​​sekvenssitason alapuolella ja se kuuluu siten uuteen bakteeriperheeseen, jota ehdotamme "Ca.E. malaspinii" tyyppilajina ja "Ca.Eudormicrobiaceae” virallisena nimenä (lisätiedot).Lyhyt metagenominen rekonstruktio 'Ca.E. malaspinii -genomiprojekti validoitiin erittäin alhaisella syötteellä, pitkällä luetulla metagenomisella sekvensoinnilla ja yhden näytteen kohdistetulla kokoonpanolla (Menetelmät) yhdeksi 9,63 Mb:n lineaariseksi kromosomiksi, jossa on 75 kb:n kopiointi.ainoana jäljellä olevana epäselvyytenä.
Tämän lajin fylogeneettisen kontekstin määrittämiseksi etsimme 40 läheistä sukua olevaa lajia muista eukaryoottisilla rikastetuista metagenomisista näytteistä Tara Oceanin tutkimusmatkalta kohdennetun genomin rekonstruoinnin avulla.Lyhyesti sanottuna olemme yhdistäneet metagenomiset lukemat genomiin fragmentteihin, jotka liittyvät "Ca.E. malaspinii” ja oletti, että lisääntynyt rekrytointiaste tässä otoksessa osoittaa muiden sukulaisten läsnäoloa (menetelmät).Tuloksena löysimme 10 MAG:ta, 19 MAG:n yhdistelmän, jotka edustavat viittä lajia kolmessa suvussa äskettäin määritellyssä suvussa (eli "Ca. Eudormicrobiaceae").Manuaalisen tarkastuksen ja laadunvalvonnan (laajennetut tiedot, kuva 6 ja lisätiedot) jälkeen havaitsimme, että "Ca.Eudormicrobiaceae-lajeissa on suurempi genomit (8 Mb) ja rikkaampi biosynteettinen potentiaali (14-22 BGC per laji) kuin muilla "Ca"-jäsenillä.Clade Eremiobacterota (jopa 7 BGC) (kuvat 3a–c).
a, Viiden Ca:n fylogeneettiset sijainnit.Eudormicrobiaceae-lajit osoittivat BGC-rikkautta, joka on ominaista tässä tutkimuksessa tunnistetuille merilinjoille.Fylogeneettinen puu sisältää kaikki 'Ca.MAG Eremiobacterotaa ja muiden fylan jäseniä (genominumerot suluissa) käytettiin GTDB:ssä (versio 89) evoluutiotaustana (Menetelmät).Uloimmat kerrokset edustavat luokituksia perhetasolla ("Ca. Eudormicrobiaceae" ja "Ca. Xenobiaceae") ja luokkatasolla ("Ca. Eremiobacteria").Tässä tutkimuksessa kuvattuja viittä lajia edustavat aakkosnumeeriset koodit ja ehdotetut binomiaaliset nimet (lisätiedot).b, okei.Eudormicrobiaceae-lajeissa on seitsemän yhteistä BGC-ydintä.BGC:n puuttuminen A2-kladista johtui edustavan MAG:n epätäydellisyydestä (lisätaulukko 3).BGC:t ovat ominaisia ​​"Ca.Amphithomicrobium" ja "Ca.Amphithomicrobium” (luokka A ja B) ei näy.c, Kaikki BGC:t, jotka on koodattu nimellä "Ca.Eudoremicrobium taraoceanii ilmentyi 623 metatranskriptiossa Taran valtameristä.Kiinteät ympyrät osoittavat aktiivista transkriptiota.Oranssit ympyrät osoittavat log2-muunnettuja kerta-muutoksia talonpitogeenin ilmentymisnopeuden ala- ja yläpuolella (menetelmät).d, suhteellinen runsauskäyrät (menetelmät), jotka osoittavat 'Ca.Eudormicrobiaceae-lajit ovat laajalle levinneitä useimmissa valtamerien altaissa ja koko vesipatsaassa (pinnasta vähintään 4000 metrin syvyyteen).Näiden arvioiden perusteella havaitsimme, että 'Ca.E. malaspinii' muodostaa jopa 6 % prokaryoottisoluista syvänmeren pelagisissa jyviin liittyvissä yhteisöissä.Ajattelimme lajin esiintyvän paikassa, jos se löydettiin missä tahansa osassa tietyn syvyyskerroksen koosta.IO – Intian valtameri, NAO – Pohjois-Atlantti, NPO – Pohjois-Tyynimeri, RS – Punainen meri, SAO – Etelä-Atlantti, SO – Eteläinen valtameri, SPO – Etelä-Tyynimeri.
Ca:n runsauden ja jakautumisen tutkiminen.Eudormicrobiaceae, joka, kuten havaitsimme, vallitsee useimmissa valtamerien altaissa sekä koko vesipatsaassa (kuva 3d).Paikallisesti ne muodostavat 6 % meren mikrobiyhteisöstä, mikä tekee niistä tärkeän osan maailmanlaajuista meren mikrobiomia.Lisäksi löysimme Ca:n suhteellisen sisällön.Eudormicrobiaceae-lajit ja niiden BGC-ilmentymistasot olivat korkeimmat rikastetussa eukaryoottisessa fraktiossa (kuva 3c ja laajennetut tiedot, kuva 7), mikä viittaa mahdolliseen vuorovaikutukseen hiukkasten, mukaan lukien planktonin, kanssa.Tämä havainto muistuttaa jonkin verran 'Ca.Eudoremicrobium BGC:t, jotka tuottavat sytotoksisia luonnontuotteita tunnettuja reittejä pitkin, voivat osoittaa saalistuskäyttäytymistä (lisätiedot ja laajennetut tiedot, kuva 8), samanlaista kuin muut petoeläimet, jotka tuottavat spesifisesti metaboliitteja, kuten Myxococcus41.Ca:n löytö.Eudormicrobiaceae vähemmän saatavilla olevissa (syvän valtameren) tai eukaryoottisissa näytteissä prokaryoottisten sijaan saattaa selittää, miksi nämä bakteerit ja niiden odottamaton BGC-monimuotoisuus jäävät epäselväksi luonnonruokatutkimuksen yhteydessä.
Lopulta pyrimme vahvistamaan kokeellisesti mikrobiomipohjaisen työmme lupauksen uusien reittien, entsyymien ja luonnontuotteiden löytämisessä.Eri BGC-luokkien joukossa RiPP-reitin tiedetään koodaavan runsasta kemiallista ja toiminnallista monimuotoisuutta kypsien entsyymien ydinpeptidin erilaisista translaation jälkeisistä modifikaatioista42.Joten valitsimme kaksi Ca.Eudoremicrobium' RiPP BGC:t (kuvat 3b ja 4a-e) perustuvat samaan kuin mikä tahansa tunnettu BGC (\(\bar{d}\)MIBiG ja \(\bar{d}\)RefSeq yli 0,2) .
a–c, In vitro heterologinen ilmentyminen ja in vitro entsymaattiset analyysit uudesta (\(\bar{d}\)RefSeq = 0,29) RiPP-biosynteesin klusterista, joka on spesifinen syvänmeren Ca-lajeille.E. malaspinii' johti difosforyloitujen tuotteiden tuotantoon.c, modifikaatiot, jotka tunnistettiin käyttämällä korkean erotuskyvyn (HR) MS/MS:ää (fragmentoituminen osoitettu b- ja y-ioneilla kemiallisessa rakenteessa) ja NMR:ää (laajennettu data, kuva 9).d, tällä fosforyloidulla peptidillä on alhainen mikromolaarinen nisäkkään neutrofiilielastaasin esto, jota ei löydy kontrollipeptidistä ja dehydratoivasta peptidistä (kemiallisen poiston aiheuttama dehydraatio).Koe toistettiin kolme kertaa samanlaisilla tuloksilla.Esimerkiksi toisen uuden \(\bar{d}\)RefSeq = 0,33) proteiinibiosynteesin klusterin heterologinen ilmentäminen selvittää neljän kypsän entsyymin toiminnan, jotka modifioivat 46 aminohapon ydinpeptidiä.Jäännökset värjätään HR-MS/MS:n, isotooppileimauksen ja NMR-analyysin (lisätiedot) ennustaman modifikaatiokohdan mukaisesti.Katkoviivaväri osoittaa, että modifikaatio tapahtuu jommassakummassa kahdesta jäännöksestä.Kuvio on kokoelma lukuisista heterologisista rakenteista, jotka osoittavat kaikkien samassa ytimessä olevien kypsien entsyymien aktiivisuuden.h, Kuva runkoamidin N-metyloinnin NMR-tiedoista.Täydelliset tulokset näkyvät kuvassa.10 laajennetuilla tiedoilla.i, Kypsän FkbM-proteiiniklusterientsyymin fylogeneettinen sijainti kaikkien MIBiG 2.0 -tietokannasta löydettyjen FkbM-domeenien joukossa paljastaa tämän perheen entsyymin, jolla on N-metyylitransferaasiaktiivisuutta (lisätiedot).Kaaviokaaviot BGC:istä (a, e), prekursoripeptidirakenteista (b, f) ja luonnontuotteiden oletetuista kemiallisista rakenteista (c, g) esitetään.
Ensimmäinen RiPP-reitti (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) löydettiin vain syvänmeren lajeista "Ca.E. malaspinii” ja koodit peptidiprekursoria (kuvat 4a, b).Tässä kypsässä entsyymissä olemme tunnistaneet yhden toiminnallisen domeenin, joka on homologinen lantipeptidisyntaasin dehydraatiodomeenille, joka normaalisti katalysoi fosforylaatiota ja sitä seuraavaa 43:n poistamista (lisätiedot).Siksi ennustamme, että prekursoripeptidin modifikaatio sisältää tällaisen kaksivaiheisen dehydraation.Kuitenkin käyttämällä tandemmassaspektrometriaa (MS/MS) ja ydinmagneettista resonanssispektroskopiaa (NMR) tunnistimme polyfosforyloidun lineaarisen peptidin (kuvio 4c).Vaikka se oli odottamatonta, löysimme useita todisteita, jotka tukevat sen olevan lopputuote: kaksi erilaista heterologista isäntää ja ei dehydraatiota in vitro -määrityksissä, kypsän entsyymin katalyyttisessä dehydraatiokohdassa mutatoituneiden keskeisten tähteiden tunnistaminen.kaikki rekonstruoi "Ca".E. malaspinii -genomi (laajennetut tiedot, kuva 9 ja lisätiedot) ja lopuksi fosforyloidun tuotteen biologinen aktiivisuus, mutta ei kemiallisesti syntetisoitu dehydratoitu muoto (kuvio 4d).Itse asiassa havaitsimme, että sillä on alhainen mikromolaarinen proteaasia estävä aktiivisuus neutrofiilien elastaasia vastaan, mikä on verrattavissa muihin vastaaviin luonnontuotteisiin pitoisuusalueella (IC50 = 14,3 μM) 44 huolimatta siitä, että ekologinen rooli on vielä selvittämättä.Näiden tulosten perusteella ehdotamme reitin nimeämistä "fosfeptiiniksi".
Toinen tapaus on monimutkainen RiPP-reitti, joka on spesifinen 'Ca.Eudoremicrobium-suvun (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) ennustettiin koodaavan luonnollisia proteiinituotteita (kuvio 4e).Nämä reitit ovat erityisen kiinnostavia bioteknologisesti, koska suhteellisen lyhyiden BGC:iden45 koodaamien entsyymien aikaansaamat epätavalliset kemialliset modifikaatiot ovat odotettavissa ja vaihtelevat.Havaitsimme, että tämä proteiini eroaa aiemmin karakterisoiduista proteiineista siinä, että siitä puuttuu sekä polykeramidien NX5N-päämotiivi että landoramidien lantioniinisilmukka46.Yleisten heterologisten ilmentymismallien rajoitusten voittamiseksi käytimme niitä yhdessä mukautetun Microvirgula aerodenitrificans -järjestelmän kanssa neljän kypsän reitin entsyymin (menetelmien) karakterisoimiseksi.Käyttämällä MS/MS:n, isotooppileimauksen ja NMR:n yhdistelmää havaitsimme nämä kypsät entsyymit peptidin 46 aminohapon ytimestä (kuvat 4f,g, laajennetut tiedot, kuvat 10-12 ja lisätiedot).Kypsistä entsyymeistä karakterisoimme FkbM O-metyylitransferaasiperheen jäsenen 47 ensimmäistä esiintymistä RiPP-reitillä ja havaitsimme yllättäen, että tämä kypsä entsyymi tuo mukanaan rungon N-metylaation (kuvio 4h, i ja lisätiedot).Vaikka tämä modifikaatio tunnetaan luonnollisissa NRP48-tuotteissa, amidisidosten entsymaattinen N-metylointi on monimutkainen, mutta bioteknisesti merkittävä reaktio49, joka on tähän asti kiinnostanut RiPP-borosiinien perhettä.Spesifisyys 50,51.Tämän aktiivisuuden tunnistaminen muissa entsyymiperheissä ja RiPP:ssä voi avata uusia sovelluksia ja laajentaa proteiinien 52 toiminnallista monimuotoisuutta ja niiden kemiallista monimuotoisuutta.Tunnistautuneiden muutosten ja ehdotetun tuoterakenteen epätavallisen pituuden perusteella ehdotamme reitin nimeä "pythonamidi".
Odottamattoman entsymologian löytö toiminnallisesti karakterisoidussa entsyymiperheessä havainnollistaa ympäristögenomiikan lupausta uusille löydöksille ja havainnollistaa myös rajoitettua kykyä tehdä toiminnallisia päätelmiä pelkästään sekvenssihomologian perusteella.Siten yhdessä ei-kanonisten bioaktiivisten polyfosforyloitujen RiPP:iden raporttien kanssa tuloksemme osoittavat resurssiintensiivistä mutta kriittistä arvoa synteettisen biologian pyrkimyksille paljastaa täysin biokemiallisten yhdisteiden toiminnallinen rikkaus, monimuotoisuus ja epätavalliset rakenteet.
Tässä esittelemme mikrobien koodaaman biosynteettisen potentiaalin ja niiden genomisen kontekstin maailmanlaajuisessa meren mikrobiomissa, mikä helpottaa tulevaa tutkimusta asettamalla tuloksena saadun resurssin tiedeyhteisön saataville (https://microbiomics.io/ocean/).Huomasimme, että suuri osa sen fylogeneettisestä ja toiminnallisesta uutuudesta voidaan saada vain rekonstruoimalla MAG:t ja SAG:t, erityisesti vajaakäytössä olevissa mikrobiyhteisöissä, jotka voisivat ohjata tulevia bioetsintäponnisteluja.Vaikka keskitymme tässä "Ca.Eudormicrobiaceae" sukupuuna, joka on erityisen biosynteettisesti "lahjakas", monet löytämättömässä mikrobiotassa ennustetut BGC:t koodaavat todennäköisesti aiemmin kuvaamattomia entsymologioita, jotka tuottavat yhdisteitä, joilla on ympäristön kannalta ja/tai bioteknisesti merkittäviä vaikutuksia.
Metagenomiset tietojoukot suurista valtameritutkimuksista ja aikasarjatutkimuksista, joissa oli riittävä sekvensointisyvyys, sisällytettiin maailmanlaajuisten meren mikrobiyhteisöjen kattavuuden maksimoimiseksi valtamerten altaissa, syvissä kerroksissa ja ajan mittaan.Nämä tietojoukot (lisätaulukko 1 ja kuva 1) sisältävät metagenomiikkaa näytteistä, jotka on kerätty Taran valtameristä (virusrikastettu, n = 190; prokaryoottirikastettu, n = 180) 12, 22 ja BioGEOTRACES-retkikunta (n = 480).Hawaiian Oceanic Time Series (HOT, n = 68), Bermuda-Atlantic Time Series (BATS, n = 62)21 ja Malaspina Expedition (n = 58)23.Sekvensointilukemat kaikista metagenomisista fragmenteista suodatettiin laadun suhteen käyttämällä BBMap-ohjelmaa (v.38.71) poistamalla sekvensointisovittimet lukemista, poistamalla laadunvalvontasekvensseihin kartoitetut lukemat (PhiX-genomit) ja käyttämällä trimq=14, maq=20 hylkää huonon lukulaadun, maxns = 0 ja minlength = 45. Myöhemmät analyysit suoritettiin tai ne yhdistettiin QC-lukemiin, jos määrättiin (bbmerge.sh minoverlap = 16).QC-lukemat normalisoitiin (bbnorm.sh-tavoite = 40, minddepth = 0) ennen rakentamista metaSPAdeilla (v.3.11.1 tai v.3.12 tarvittaessa)53.Tuloksena saadut telinejatkokset (jota tästä eteenpäin kutsutaan telineiksi) suodatettiin lopuksi pituuden (≥1 kb) mukaan.
1038 metagenomista näytettä jaettiin ryhmiin, ja jokaiselle näyteryhmälle kaikkien näytteiden metagenomisen laadunvalvontalukemat kohdistettiin kunkin näytteen hakasulkeisiin erikseen, mikä johti seuraavaan pareittain hakasulkeisiin ryhmälukemiin: Tara Marine Viruses – Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) ja Malaspina (58×58).Kartoitus tehtiin käyttämällä Burrows-Wheeler-Aligneria (BWA) (v.0.7.17-r1188)54, jonka avulla lukemat voidaan sovittaa toissijaisiin paikkoihin (käyttäen -a-lippua).Kohdistus suodatettiin vähintään 45 emäksen pituisiksi, ≥97 %:n identtisiksi ja ≥80 %:n lukemiksi.Tuloksena saadut BAM-tiedostot käsiteltiin käyttämällä jgi_summarize_bam_contig_depths-skriptiä MetaBAT2:lle (v.2.12.1)55, jotta jokaiselle ryhmälle saatiin näytteen sisäinen ja välinen kattavuus.Lopuksi hakasulkeet ryhmiteltiin herkkyyden lisäämiseksi suorittamalla yksittäin MetaBAT2 kaikissa näytteissä, joissa on –minContig 2000 ja –maxEdges 500. Käytämme MetaBAT2:ta ensemble boxerin sijaan, koska sen on osoitettu riippumattomissa testeissä olevan tehokkain yksittäinen nyrkkeilijä.ja 10-50 kertaa nopeampi kuin muut yleisesti käytetyt nyrkkeilijät57.Runsauskorrelaatioiden vaikutuksen testaamiseksi satunnaisesti valitussa metagenomiikan osanäytteessä (10 kummallekin Tara Ocean -tietojoukolle, 10 BioGEOTRACESille, 5 jokaiselle aikasarjalle ja 5 Malaspinalle) käytettiin lisäksi vain näytteitä.Sisäiset näytteet ryhmitellään kattavuustietojen saamiseksi.(Lisäinformaatio).
Myöhemmin tehtyyn analyysiin sisällytettiin lisää (ulkoisia) genomeja, nimittäin 830 manuaalisesti valittua MAG:ta Tara Oceans26 -tietojoukosta, 5 287 SAG:ta GORG20-tietojoukosta ja tiedot MAR-tietokannasta (MarDB v. 4) 1707 eristetystä REF:stä ja 682 SAG:ta) 27. MarDB-tietojoukolle genomit valitaan saatavilla olevien metatietojen perusteella, jos näytetyyppi vastaa seuraavaa säännöllistä lauseketta: '[S|s]ingle.?[C|c]ell|[C|c]ulture| [I|i] eristetty'.
Kunkin metagenomisen säiliön ja ulkoisten genomien laatu arvioitiin käyttämällä CheckM:ää (v.1.0.13) ja Anvi'on Lineage Workflow:ta (v.5.5.0)58,59.Jos CheckM tai Anvi'o raportoi ≥50 % täydellisyydestä/täydellisyydestä ja ≤10 % kontaminaatiosta/redundanssista, tallenna metagenomiset solut ja ulkoiset genomit myöhempää analyysiä varten.Nämä pisteet yhdistettiin sitten keskimääräiseksi täydellisyydeksi (mcpl) ja keskimääräiseksi kontaminaatioksi (mctn) genomin laadun luokittelemiseksi yhteisön kriteerien mukaan60 seuraavasti: korkea laatu: mcpl ≥ 90 % ja mctn ≤ 5 %;hyvä laatu: mcpl ≥ 70 %, mctn ≤ 10 %, keskilaatuinen: mcpl ≥ 50 % ja mctn ≤ 10 %, kohtuullinen laatu: mcpl ≤ 90 % tai mctn ≥ 10 %.Suodatetut genomit korreloitiin sitten laatupisteiden (Q ja Q') kanssa seuraavasti: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (kannan vaihtelu)/100 + 0,5 x log[N50].(toteutettu dRep61:ssä).
Eri tietolähteiden ja genomityyppien (MAG, SAG ja REF) vertailevan analyysin mahdollistamiseksi 34 799 genomista poistettiin viittaukset genominlaajuisen keskimääräisen nukleotidi-identiteetin (ANI) perusteella käyttämällä dRep-menetelmää (v.2.5.4).Toistetaan)61 95 % ANI-kynnyksillä28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) ja yhden kopion markkerigeenit käyttämällä SpecI63:a, jotka tarjoavat genomin klusteroitumisen lajitasolla.Edustava genomi valittiin kullekin dRep-klusterille edellä määritellyn maksimilaatupisteen (Q') mukaisesti, jonka katsottiin edustavan lajia.
Kartoitusnopeuden arvioimiseksi BWA:ta (v.0.7.17-r1188, -a) käytettiin kartoittamaan kaikki 1038 metagenomista lukusarjaa OMD:n sisältämillä 34 799 genomilla.Laatuvalvotut lukemat kartoitettiin yksipäätteisessä tilassa ja tuloksena saadut kohdistukset suodatettiin säilyttämään vain ≥ 45 bp pituiset kohdistukset.ja identiteetti ≥ 95 %.Kunkin näytteen näyttösuhde on suodatuksen jälkeen jäljellä olevien lukemien prosenttiosuus jaettuna laadunvalvontalukemien kokonaismäärällä.Käyttämällä samaa lähestymistapaa jokainen 1038 metagenomista vähennettiin 5 miljoonaan inserttiin (laajennettu data, kuva 1c) ja sovitettiin GORG SAG:iin OMD:ssä ja kaikissa GEM16:ssa.Merivedestä talteen otettujen MAG-yhdisteiden määrä GEM16-luettelossa määritettiin metagenomisten lähteiden hakusanakyselyillä, merivesinäytteiden valinnalla (esim. toisin kuin merisedimentit).Tarkemmin sanottuna valitsemme "aquatic" kohdassa "ekosysteemin_luokka", "meren" "ekosysteemin_tyypiksi" ja suodatamme "elinympäristön" muotoon "syvä valtameri", "meri", "merellinen meri", "pelaginen meri", "merivesi", "Meri", "Merivesi", "Pintamerivesi", "Pintamerivesi".Tämä johti 5 903 MAG:iin (734 korkealaatuista), jotka jaettiin 1 823 OTU:lle (näkymät täältä).
Prokaryoottigenomit merkittiin taksonomisesti käyttämällä GTDB-Tk (v.1.0.2)64:ää oletusparametreilla, jotka kohdistuivat GTDB r89 -versioon 13. Anvi'oa käytettiin tunnistamaan eukaryoottigenomit domeenin ennusteen ja palautuksen perusteella ≥50 % ja redundanssin ≤ 10 % perusteella.Lajin taksonominen annotaatio määritellään yhdeksi sen edustavista genomeista.Lukuun ottamatta eukaryootteja (148 MAG), jokainen genomi merkittiin ensin toiminnallisesti annotaatiolla käyttämällä prokka (v.1.14.5)65, nimeäen täydelliset geenit, määrittelemällä "arkea" tai "bakteeri" parametrit tarpeen mukaan, mikä raportoidaan myös ei- koodaavia geenejä.ja CRISPR-alueet muiden genomiominaisuuksien joukossa.Merkitse ennustetut geenit tunnistamalla universaalit yhden kopion markkerigeenit (uscMG) käyttämällä fetchMG:tä (v.1.2)66, määritä ortologiset ryhmät ja tee kysely emapperilla (v.2.0.1)67 eggNOG:n (v.5.0)68 perusteella.KEGG-tietokanta (julkaistu 10. helmikuuta 2020) 69. Viimeinen vaihe suoritettiin sovittamalla proteiinit KEGG-tietokantaan käyttämällä DIAMOND (v.0.9.30)70:tä kyselyn ja aiheen kattavuuden ollessa ≥70 %.Tulokset suodatettiin edelleen NCBI Prokaryotic Genome Annotation Pipeline71:n mukaisesti bittinopeuden perusteella, joka oli ≥ 50 % suurimmasta odotetusta bittinopeudesta (itse linkki).Geenisekvenssejä käytettiin myös syötteenä BGC:iden tunnistamiseen genomissa käyttämällä antiSMASH (v.5.1.0)72:ta oletusparametreilla ja erilaisilla klusteriräjähdyksillä.Kaikki genomit ja annotaatiot on koottu OMD:hen sekä kontekstuaaliset metatiedot, jotka ovat saatavilla verkossa (https://microbiomics.io/ocean/).
Samalla tavalla kuin aiemmin kuvatut menetelmät12,22 käytimme CD-HIT:tä (v.4.8.1) ryhmittelemään >56,6 miljoonaa proteiinia koodaavaa geeniä bakteerien ja arkkien genomeista OMD:stä 95 %:n identtisyyteen ja lyhyemmiksi geeneiksi (90 %:n kattavuus)73 asti. >17,7 miljoonaa geeniklusteria.Pisin sekvenssi valittiin kunkin geeniklusterin edustavaksi geeniksi.1038 metagenomia sovitettiin sitten > 17,7 miljoonaan BWA (-a) -klusterin jäseneen ja tuloksena saadut BAM-tiedostot suodatettiin säilyttämään vain linjaukset, joiden identtisyys oli ≥95 % ja peruslinjaukset ≥45.Pituusnormalisoitujen geenien runsaus laskettiin laskemalla ensin insertit parhaasta ainutlaatuisesta kohdistuksesta ja sitten sumeasti kartoitetuille inserteille lisäämällä murtolukuja vastaaviin kohdegeeneihin suhteessa niiden ainutlaatuisten inserttien määrään.
Laajennetun OMD:n genomit (muilla MAG:illa "Ca. Eudormicrobiaceae", katso alla) lisättiin mOTUs74 metagenomisen analyysityökalun tietokantaan (v.2.5.1) laajennetun mOTU-viitetietokannan luomiseksi.Vain kuusi yhden kopion genomia (23 528 genomia) säilyi hengissä kymmenestä uscMG:stä.Tietokannan laajentaminen johti 4 494 lisäklusteriin lajitasolla.1038 metagenomia analysoitiin käyttämällä oletusarvoisia mOTU-parametreja (v.2).Yhteensä 989 genomia, jotka sisältyivät 644 mOTU-klusteriin (95 % REF, 5 % SAG ja 99,9 % kuuluvat MarDB:hen), ei havaittu mOTU-profiililla.Tämä heijastaa useita MarDB-genomien merieristyksen lisälähteitä (useimmat havaitsemattomat genomit liittyvät sedimenteistä eristettyihin organismeihin, meriisänteihin jne.).Jatkaksemme keskittymistä avomeriympäristöön tässä tutkimuksessa, jätimme ne pois alavirran analyysistä, ellei niitä havaittu tai sisällytetty tässä tutkimuksessa luotuun laajennettuun mOTU-tietokantaan.
Kaikki BGC:t MAG:sta, SAG:sta ja REF:stä OMD:ssä (katso edellä) yhdistettiin BGC:ihin, jotka tunnistettiin kaikissa metagenomisissa tukirakenteissa (antiSMASH v.5.0, oletusparametrit) ja karakterisoitiin käyttämällä BiG-SLICE:tä (v.1.1) (PFAM-domeeni)75.Näiden ominaisuuksien perusteella laskemme kaikki kosinietäisyydet BGC:iden välillä ja ryhmittelimme ne (keskimääräiset linkit) GCF:ksi ja GCC:ksi käyttämällä etäisyyskynnysarvoja 0,2 ja 0,8.Nämä kynnykset ovat sovitus kynnyksistä, joita aiemmin käytettiin käyttämällä euklidista etäisyyttä75 yhdessä kosinietäisyyden kanssa, mikä lieventää joitain alkuperäisen BiG-SLICE-klusterointistrategian virheitä (lisätiedot).
Tämän jälkeen BGC:t suodatettiin säilyttämään vain ≥ 5 kb:n koodattu rakennustelineille fragmentoitumisriskin vähentämiseksi, kuten aiemmin on kuvattu16, ja sulkea pois MarDB REF:t ja SAG:t, joita ei löydy 1038 metagenomista (katso edellä).Tämä johti siihen, että OMD-genomi koodaa yhteensä 39 055 BGC:tä ja lisäksi 14 106 tunnistettiin metagenomisista fragmenteista (eli niitä ei yhdistetty MAG:iksi).Näitä "metagenomisia" BGC:itä käytettiin arvioimaan meren mikrobiomin biosynteesipotentiaalin osuutta, jota ei ole tallennettu tietokantaan (lisätiedot).Jokainen BGC karakterisoitiin toiminnallisesti ennakoivien tuotetyyppien mukaan, jotka on määritelty anti-SMASH- tai karkeammilla tuotekategorioilla, jotka on määritelty BiG-SCAPE76:ssa.Näytteenoton vääristymisen estämiseksi kvantitatiivisessa määrityksessä (GCC/GCF:n taksonominen ja toiminnallinen koostumus, GCF:n ja GCC:n etäisyys vertailutietokantoihin ja GCF:n metagenominen runsaus) säilyttämällä vain pisin BGC per GCF kullekin lajille, 39 055 BGC:tä poistettiin edelleen. tuloksena yhteensä 17 689 BGC.
GCC:n ja GCF:n uutuus arvioitiin lasketun tietokannan (RefSeq-tietokanta BiG-FAM:ssa)29 ja kokeellisesti varmennetun (MIBIG 2.0)30 BGC:n välisen etäisyyden perusteella.Valitsimme kullekin 17 689 edustavasta BGC:stä pienimmän kosinietäisyyden vastaavaan tietokantaan.Näistä vähimmäisetäisyyksistä lasketaan sitten keskiarvo (keskiarvo) GCF:n tai GCC:n mukaan, tapauksen mukaan.GCF katsotaan uudeksi, jos etäisyys tietokantaan on suurempi kuin 0,2, mikä vastaa ihanteellista eroa (keskimääräisen) GCF:n ja referenssin välillä.Valitsemme GCC:lle arvon 0,4, joka on kaksi kertaa GCF:n määrittämä kynnys, lukitaksemme pitkäaikaisen suhteen linkkien kanssa.
BGC:n metagenominen runsaus arvioitiin sen biosynteettisten geenien keskimääräiseksi runsaudeksi (määritettynä anti-SMASH:lla), joka on saatavilla geenitason profiileista.Kunkin GCF:n tai GCC:n metagenominen runsaus laskettiin sitten edustavien BGC:iden summana (17 689:stä).Nämä runsauskartat normalisoitiin myöhemmin solukoostumukselle käyttämällä näytettä kohden mOTU-lukua, joka vastasi myös sekvensointiponnisteluja (laajennetut tiedot, kuva 1d).GCF:n tai GCC:n esiintyvyys laskettiin prosentteina näytteistä, joiden runsaus oli > 0.
Euklidinen etäisyys näytteiden välillä laskettiin normalisoidusta GCF-profiilista.Näitä etäisyyksiä pienennettiin käyttämällä UMAP77:ää ja tuloksena saatuja upotuksia käytettiin valvomattomaan tiheyteen perustuvaan klusterointiin HDBSCAN78:lla.HDBSCANin käyttämä klusterin optimaalinen vähimmäispistemäärä (ja siten klusterien lukumäärä) määritetään maksimoimalla klusterin jäsenyyden kumulatiivinen todennäköisyys.Tunnistetut klusterit (ja näiden klustereiden satunnainen tasapainotettu osaotos permutaatiomonimuuttujavarianssianalyysin (PERMANOVA) poikkeaman huomioon ottamiseksi) testattiin merkitsevyyden suhteen pienentämättömiä euklidisia etäisyyksiä vastaan ​​käyttämällä PERMANOVAa.Näytteiden keskimääräinen genomikoko laskettiin mOTU:n suhteellisen runsauden ja genomien jäsenten arvioidun genomikoon perusteella.Erityisesti kunkin mOTU:n keskimääräinen genomikoko arvioitiin sen jäsenten genomikokojen keskiarvona korjattuna täydellisyyden suhteen (suodatuksen jälkeen) (esimerkiksi 75-prosenttisesti täydellisellä genomilla, jonka pituus on 3 Mb, sovitettu koko on 4 Mb).keskikokoisille genomeille, joiden eheys on ≥ 70 %.Kunkin näytteen keskimääräinen genomikoko laskettiin sitten suhteellisella runsaudella painotettujen mOTU-genomikokojen summana.
Suodatettu joukko genomin koodaamia BGC:itä OMD:ssä on esitetty bakteeri- ja arkeologisissa GTDB-puissa (≥5 kb:n kehyksissä, pois lukien REF ja SAG MarDB, joita ei löydy 1038 metagenomista, katso edellä) ja niiden ennustetut tuoteluokat fylogeneettisen perusteella. genomin asema (katso edellä).Pelasimme ensin tiedot lajeittain käyttämällä edustavana genomia, jossa on eniten BGC:itä kyseisessä lajissa.Visualisointia varten edustajat jaettiin edelleen puuryhmiin, ja jälleen jokaiselle solukladille valittiin edustajaksi genomi, joka sisälsi suurimman määrän BGC:itä.BGC:llä rikastettuja lajeja (vähintään yksi genomi, jossa on >15 BGC:tä) analysoitiin edelleen laskemalla Shannonin monimuotoisuusindeksi näissä BGC:issä koodaamille tuotetyypeille.Jos kaikki ennustetut tuotetyypit ovat samat, kemiallisten hybridien ja muiden monimutkaisten BGC:iden (kuten anti-SMAH ennustaa) katsotaan kuuluvan samaan tuotetyyppiin riippumatta niiden järjestyksestä klusterissa (esim. proteiini-bakteriosiini ja bakteriosiini-proteiini-fuusio runko).hybridi).
Jäljelle jäävä DNA (arviolta 6 ng) Malaspina-näytteestä MP1648, joka vastaa biologista näytettä SAMN05421555 ja sovitettiin Illumina SRR3962772:n metagenomiseen lukusarjaan lyhyttä lukua varten, käsitelty PacBio-sekvensointiprotokollan mukaisesti erittäin alhaisella syöttömäärällä Pacbellamplification gDNA -näytesarjan Pacbellamplification Kitin käyttämiseksi. pakki (100-980-000) ja SMRTbell Express 2.0 -mallin valmistelusarja (100-938-900).Lyhyesti sanottuna jäljellä oleva DNA leikattiin, korjattiin ja puhdistettiin (ProNex-helmet) käyttämällä Covarisia (g-TUBE, 52104).Sitten puhdistetulle DNA:lle tehdään kirjaston valmistus, monistus, puhdistus (ProNex-helmet) ja koon valinta (>6 kb, Blue Pippin) ennen lopullista puhdistusvaihetta (ProNex-helmet) ja sekvensointi Sequel II -alustalla.
Kahden ensimmäisen jälleenrakennus n.MAG Eremiobacterotan osalta tunnistimme kuusi ylimääräistä ANI:tä > 99 % (nämä sisältyvät kuvioon 3), jotka suodatettiin alun perin kontaminaatiopisteiden perusteella (tunnistettiin myöhemmin geenin kaksoiskappaleiksi, katso alla).Löysimme myös lokeron, jossa on merkintä "Ca".Eremiobacterota” eri tutkimuksista23 ja käytti niitä yhdessä kahdeksan tutkimuksemme MAG:n kanssa referenssinä metagenomisille lukemille 633 eukaryoottisesta rikastetusta (>0,8 µm) näytteestä käyttäen BWA:ta (v.0.7.17) Ref -r1188, – lippu) alasnäytteenottoa varten. kartoitus (5 miljoonaa lukemaa).Rikastuskohtaisten karttojen perusteella (suodatettu 95 %:n kohdistusidentiteetillä ja 80 %:n lukupeitolla) 10 metagenomia (odotettu peitto ≥5×) valittiin kokoonpanoa varten ja 49 metagenomia (odotettu peitto ≥1×) sisältökorrelaatiota varten.Käyttämällä samoja parametreja kuin edellä, nämä näytteet yhdistettiin ja 10 ylimääräistä Ca:ta lisättiin.MAG Eremiobacterota on palautettu.Nämä 16 MAG:ta (lukuun ottamatta kahta tietokannassa jo olevaa) nostavat genomien kokonaismäärän laajennetussa OMD:ssä 34 815:een.MAG:ille määrätään taksonomiset arvot niiden genomisen samankaltaisuuden ja aseman perusteella GTDB:ssä.18 MAG:n replikaatio poistettiin käyttämällä dRep:tä 5 lajiksi (sisäinen ANI > 99 %) ja 3 suvuksi (sisäinen ANI 85–94 %) samassa perheessä79.Lajien edustajat valittiin manuaalisesti eheyden, saastumisen ja N50:n perusteella.Ehdotettu nimikkeistö on lisätiedoissa.
Arvioi 'Ca:n eheys ja kontaminaatio.MAG Eremiobacterota, arvioimme uscMG:n sekä CheckM:n ja Anvi'on käyttämien linja- ja domeenispesifisten yhden kopion markkerigeenisarjojen esiintymisen.Kahden kaksoiskappaleen tunnistaminen 40:stä uscMG:stä varmistettiin fylogeneettisellä rekonstruktiolla (katso alla) mahdollisen kontaminaation sulkemiseksi pois (tämä vastaa 5 % näiden 40 merkkigeenin perusteella).Lisätutkimus viidestä edustavasta MAG:sta 'Ca.Epäpuhtauksien alhainen taso näissä rekonstruoiduissa genomeissa vahvistettiin Eremiobacterota-lajeille käyttämällä interaktiivista Anvi'o-rajapintaa, joka perustuu runsauden ja sekvenssikoostumuksen korrelaatioihin (lisätiedot)59.
Fylogenomista analyysiä varten valitsimme viisi edustavaa MAG:ta "Ca".Eudormicrobiaceae”, kaikki lajit ”Ca.Eremiobacterotan ja muiden fylan jäsenten (mukaan lukien UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria ja Planctomycetota) genomi on saatavilla GTDB:ltä (r89)13.Kaikki nämä genomit merkittiin, kuten aiemmin on kuvattu yhden kopion markkerigeenin uuttamiseen ja BGC-merkintään.GTDB-genomit konservoitiin yllä olevien eheys- ja kontaminaatiokriteerien mukaisesti.Fylogeneettinen analyysi suoritettiin käyttämällä Anvi'o Phylogenetics59-työnkulkua.Puu rakennettiin käyttämällä IQTREE:tä (v.2.0.3) (oletusvaihtoehdot ja -bb 1000)80 39 tandem ribosomaalisen proteiinin rinnastuksessa, jotka Anvi'o tunnistaa (MUSCLE, v.3.8.1551)81.Hänen asemansa pienentyivät.kattamaan vähintään 50 % genomista82 ja Planctomycecotaa käytettiin ulkoryhmänä GTDB-puutopologian perusteella.Yksi 40 uscMG:n puu rakennettiin samoilla työkaluilla ja parametreilla.
Käytimme Traitaria (v.1.1.2) oletusparametreilla (fenotyyppi, nukleotideista)83 yleisten mikrobiominaisuuksien ennustamiseen.Tutkimme mahdollista saalistuseläintyyliä, joka perustuu aiemmin kehitettyyn saalistusindeksiin84, joka riippuu proteiinia koodaavan geenin pitoisuudesta genomissa.Tarkemmin sanottuna käytämme DIAMONDia vertaamaan genomin proteiineja OrthoMCL-tietokantaan (v.4)85 käyttämällä vaihtoehtoja –herkempi –id 25 –query-cover 70 –subject-cover 70 –top 20 JA laskea geenit, jotka vastaavat markkerigeenit petoeläimille ja ei-petoeläimille.Indeksi on saalistusperäisten ja ei-saaliistavien merkintöjen lukumäärän erotus.Lisäkontrollina analysoimme myös "Ca"-genomia.Entotheonella TSY118 -tekijä perustuu sen assosiaatioon Ca.Eudoremicrobium (suuri genomikoko ja biosynteettinen potentiaali).Seuraavaksi testasimme mahdollisia yhteyksiä saalistajan ja ei-petoeläinmerkkigeenien välillä ja Ca:n biosynteettistä potentiaalia.Eudormicrobiaceae" ja havaitsivat, että vain yksi geeni (mistä tahansa merkkigeenistä, eli saalistajan/ei-petoeläingeenistä) on päällekkäinen BGC:n kanssa, mikä viittaa siihen, että BGC ei sekoita saalistussignaaleja.Sekoitettujen replikonien genominen lisämerkintä suoritettiin käyttämällä TXSSCAN:ia (v.1.0.2) eritysjärjestelmän, piluksen ja flagella86:n spesifisen tutkimiseksi.
Viisi edustavaa Ca:ta kartoitettiin kartoittamalla 623 metatranskriptiä Taran valtamerten prokaryoottisista ja eukaryoottisista rikastusfraktioista22, 40, 87 (käyttäen BWA:ta, v.0.7.17-r1188, -a lippua).Eudormicrobiaceae-genomi.BAM-tiedostot käsiteltiin FeatureCounts (v.2.0.1)88:lla 80 %:n lukupeitton ja 95 %:n identiteetin suodatuksen jälkeen (optioilla featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Laskee inserttien lukumäärä geeniä kohti.Luodut kartat normalisoitiin geenin pituuden ja markkerigeenien runsauden mOTU:n suhteen (pituusnormalisoitu keskimääräinen insertiomäärä geeneille, joiden insertiomäärä on >0) ja log-muunnettiin arvoon 22,74, jotta saatiin kunkin geenitason suhteellinen ilmentyminen solua kohti, mikä myös selittää vaihtelu näytteestä näytteeseen sekvensoinnin aikana.Tällaiset suhteet mahdollistavat vertailevan analyysin, mikä lieventää koostumusongelmia käytettäessä suhteellista runsautta koskevia tietoja.Vain näytteet, joissa oli > 5 10 mOTU-markkerigeenistä, otettiin lisäanalyysiin, jotta riittävän suuri osa genomista havaittiin.
Normalisoitu transkriptioprofiili 'Ca.E. taraoceanii alistettiin dimensioiden vähentämiselle käyttämällä UMAP:ia ja saatua esitystä käytettiin valvomattomaan klusterointiin HDBSCAN:n avulla (katso yllä) ekspression tilan määrittämiseksi.PERMANOVA testaa alkuperäisen (ei pienennetyn) etäisyysavaruuden tunnistettujen klustereiden välisten erojen merkitystä.Erilainen ilmentyminen näiden olosuhteiden välillä testattiin genomissa (katso edellä) ja 201 KEGG-reittiä tunnistettiin 6 funktionaalisessa ryhmässä, nimittäin: BGC, eritysjärjestelmä ja flagellaariset geenit TXSSCAN:sta, hajoamisentsyymit (proteaasi ja peptidaasit) sekä saalistus- ja ei-saaliit. saalistusgeenit.saalistusindeksimerkit.Laskimme kullekin näytteelle keskimääräisen normalisoidun ilmentymisen kullekin luokalle (huomaa, että itse BGC-ilmentyminen lasketaan kyseisen BGC:n biosynteettisten geenien ilmentymisen mediaaniksi) ja testasimme merkitsevyyden eri tilojen välillä (Kruskal-Wallis-testi säädetty FDR:lle).
Synteettiset geenit ostettiin GenScriptiltä ja PCR-alukkeet ostettiin Microsynthiltä.Thermo Fisher Scientificin phusion-polymeraasia käytettiin DNA:n monistamiseen.DNA:n puhdistukseen käytettiin NucleoSpin-plasmideja, NucleoSpin-geeliä ja Macherey-Nagelin PCR-puhdistuspakkausta.Restriktioentsyymit ja T4 DNA-ligaasi ostettiin New England Biolabsilta.Muut kemikaalit kuin isopropyyli-p-d-1-tiogalaktopyranosidi (IPTG) (Biosynth) ja 1,4-ditiotreitoli (DTT, AppliChem) ostettiin Sigma-Aldrichilta ja niitä käytettiin ilman lisäpuhdistusta.Antibiootit kloramfenikoli (Cm), spektinomysiinidihydrokloridi (Sm), ampisilliini (Amp), gentamysiini (Gt) ja karbenisilliini (Cbn) ostettiin AppliChemiltä.Bacto Tryptone- ja Bacto Yeast Extract -alustakomponentit ostettiin BD Biosciencesilta.Sekvensointiin tarkoitettu trypsiini ostettiin Promegalta.
Geenisekvenssit uutettiin anti-SMASH-ennustetusta BGC 75.1:stä.E. malaspinii (lisätietoja).
Geenit embA (lokus, MALA_SAMN05422137_METAG-kehys_127-geeni_5), embM (locus, MALA_SAMN05422137_METAG-kehys_127-geeni_4) ja embAM (mukaan lukien geenien väliset alueet) rakennettiin E:ssä ilman ilmentymistä ja sekvensoitiin ilman synteettisiä rakenteita5 ja sekvensoitiin synteettisinä rakenteina. kun.EmA-geeni alakloonattiin pACYCDuet-1:n (CmR) ja pCDFDuet-1:n (SmR) ensimmäiseen moninkertaiseen kloonauskohtaan (MCS1) BamHI- ja Hindlll-katkaisukohdilla.EmM- ja embMopt-geenit (kodonioptimoitu) subkloonattiin MCS1:een pCDFDuet-1(SmR) BamHI:n ja HindIII:n kanssa ja sijoitettiin pCDFDuet-1(SmR)- ja pRSFDuet-1(KanR)-(MCS2):n toiseen moninkertaiseen kloonauskohtaan. NdeI/ChoI.EmAM-kasetti subkloonattiin pCDFDuetl:een (SmR) BamHI- ja Hindlll-katkaisukohtien kanssa.Orf3/embI-geeni (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) konstruoitiin päällekkäislaajennus-PCR:llä käyttäen alukkeita EmbI_OE_F_NdeI ja EmbI_OE_R_XhoI, pilkottiin NdeI/Xho1-Mb-restriktiolla (Xho1-Dmb) käyttäen restriktioa pCSDMF. entsyymit (täydentävä pöytä).6).Restriktioentsyymidigestio ja ligaatio suoritettiin valmistajan protokollan (New England Biolabs) mukaisesti.

 


Postitusaika: 14.3.2023