نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشگاه بوعلی سینا دانشکده کشاورزی گروه بیوتکنولوژی

2 دانشگاه بوعلی سینا

3 پژوهشگاه ملی مهندسی ژنتیک و زیست فناوری، پژوهشکدۀ زیست فناوری صنعت و محیط زیست، گروه زیست فناوری سامانه‌ای

چکیده

آنزیم‌هایGGPPS مسئول سنتز ژرانیل‌ژرانیل ‌دی‌ فسفات (GGPP)، یک پیش‌مادۀ مهم برای تولید بسیاری از ترپنوئیدها، هستند. در این تحقیق با شناسایی هومولوگ‌های خانوادۀ GGPPS در پایگاه دادۀ UniProt، روند تکاملی این خانواده با استفاده از آنالیزهای فیلوژنتیک مورد مطالعه قرار گرفت. همچنین، الگوی فرایندهای مضاعف شدن و از دست دادن ژن در طی تکامل گیاهان، با استفاده ازمعیار بهینه ‌سازی مبتنی بر پارسیمونی بررسی شد. جهت بررسی نقش فرایندهای مضاعف شدن کل ژنوم (WGD) و تکثیر تکراری ژن‌ها (TD) از پایگاه دادۀ PLAZA استفاده شد. نتایج مشخص نمود که خانوادۀ GGPPS یک خانوادۀ در حال گسترش است و در طی روند تکامل گیاهان، این خانوادۀ پروتئینی در چندین مرحلۀ متناوب فرایندهای گسترش و انقباض را تجربه نموده است. اغلب این فرایندهای گسترش در اثر پدیدۀ مضاعف شدن کل ژنوم ایجاد شده‌اند. با این وجود، فرایندهای تکثیر تکراری ژن‌ها در پدیده‌هایی که منجر به گسترش در یک تبار خاص (LSE) شده است، بیشتر به وقوع پیوسته است. همچنین بررسی تنوع جایابی پروتئین در داخل سلول(PSL) مشخص نمود که فرایند گسترش منجر به تفکیک عملکرد در این خانوادۀ پروتئینی شده است. لذا به نظر می‌رسد که گسترش خانوادۀ GGPPS در گیاهان باعث ایجاد پاسخ‌های مناسب‌تر به استرس‌ها و محرک‌های محیطی می‌شود و در نهایت به سازگاری بهتر گیاهان با محیط کمک می‌کند. بررسی اثر انتخاب طبیعی در این خانواده نشان داد که اعضای این خانواده در رده‌های مختلف گیاهان تحت تاثیر فشارهای انتخابی متفاوتی قرار دارند و انتخاب طبیعی مثبت فقط در بازدانگان مشاهده شد.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

In silico Analysis of Molecular Evolution and Expansion in Geranylgeranyl diphosphate synthase Protein Family in Plants

نویسندگان [English]

  • Sara Farahbakhsh 1
  • sonbol nazeri 2
  • Zarrin Minuchehr 3

1 Bu-Ali Sina Un. Fac. of Agriculture Dept. of Biotechnology

2 Bu-Ali Sina University

3 Systems Biotechnology Department, National Institute of Genetic Engineering and Biotechnology, Tehran, I.R. of Iran

چکیده [English]

GGPPS enzymes are responsible for the synthesis of geranyl geranyl diphosphate (GGPP), an important precursor for the production of variety terpenoids. In this study, by identifying the GGPPSs homologs UniProt database, the evolutionary process of this family was investigated using phylogenetic analysis, and the patterns of gene loss and gain over the course of evolution were inferred by parsimony-based optimization criterion. PLAZA database was used to study the role of whole genome duplication (WGD) and tandem gene duplication (TD). Results revealed that the GGPPS family is an expanding family and during plants evolution, GGPPS family has experienced expansion and contraction events in several alternate stages. Most of these expansions have been occurred as a result of the whole genome duplication (WGD) events. Nonetheless, tandem duplications (TDs) have occurred more in lineage specific expansions (LSEs). Furthermore, Protein Subcellular localization (PSL) analysis revealed that expansion process led to subfunctionalization in this protein family. Therefore, it seems that expansion in GGPPSs improve plants responses to stress and environmental stimuli, and ultimately, lead to a better adaptation to environmental conditions. Our analysis suggested that the selective pressure in different lineages of plants is variable and the positive selection was observed only in gymnosperms.

کلیدواژه‌ها [English]

  • Terpenoid
  • Geranylgeranyl diphosphate synthase
  • Whole genome duplication
  • Tandem duplication
  • lineage-specific expansion

بررسی In silico روند تکامل مولکولی و گسترش خانوادۀ پروتئینی ژرانیل‌ژرانیل‌دی فسفات‌سنتاز در گیاهان

سارا فرح بخش1، سنبل ناظری1* و زرین مینوچهر2**

1 ایران، همدان، دانشگاه بوعلی سینا همدان، دانشکدۀ کشاورزی، گروه بیوتکنولوژی

2 ایران، تهران، پژوهشگاه ملی مهندسی ژنتیک و زیست فناوری، پژوهشکدۀ زیست فناوری صنعت و محیط زیست، گروه زیست فناوری سامانه‌ای

تاریخ دریافت: 30/11/96                      تاریخ پذیرش: 27/4/97

چکیده

آنزیمهایGGPPS  مسئول سنتز ژرانیل‌ژرانیل ‌دی‌ فسفات (GGPP)، یک پیش‌ماده مهم برای تولید بسیاری از ترپنوئیدها، هستند. در این تحقیق با شناسایی هومولوگهای خانوادۀ GGPPS در پایگاه دادۀ UniProt، روند تکاملی این خانواده با استفاده از آنالیزهای فیلوژنتیک مورد مطالعه قرار گرفت. همچنین، الگوی فرآیندهای مضاعف شدن و از دست دادن ژن در طی تکامل گیاهان، با استفاده ازمعیار بهینه ‌سازی مبتنی بر پارسیمونی بررسی شد. جهت بررسی نقش فرآیندهای مضاعف شدن کل ژنوم (WGD) و تکثیر تکراری ژنها (TD) از پایگاه دادۀ PLAZA استفاده شد. نتایج مشخص نمود که خانوادۀ GGPPS یک خانوادۀ در حال گسترش است و در طی روند تکامل گیاهان، این خانوادۀ پروتئینی در چندین مرحلۀ متناوب فرآیندهای گسترش و انقباض را تجربه نموده است. اغلب این فرآیندهای گسترش در اثر پدیدۀ مضاعف شدن کل ژنوم ایجاد شده‌اند. با این وجود، فرآیندهای تکثیر تکراری ژنها در پدیده‌هایی که منجر به گسترش در یک تبار خاص (LSE) شده است، بیشتر به وقوع پیوسته است. همچنین بررسی تنوع جایابی پروتئین در داخل سلول(PSL)  مشخص نمود که فرآیند گسترش منجر به تفکیک عملکرد در این خانوادۀ پروتئینی شده است. لذا به نظر می‌رسد که گسترش خانوادۀ GGPPS در گیاهان باعث ایجاد پاسخهای مناسب‌تر به استرسها و محرکهای محیطی می‌شود و در نهایت به سازگاری بهتر گیاهان با محیط کمک می‌کند. بررسی اثر انتخاب طبیعی در این خانواده نشان داد که اعضای این خانواده در رده­های مختلف گیاهان تحت تأثیر فشارهای انتخابی متفاوتی قرار دارند و انتخاب طبیعی مثبت فقط در بازدانگان مشاهده شد.

واژه های کلیدی: ترپنوئید، ژرانیل‌ژرانیل‌دی‌ فسفات‌ سنتاز، مضاعف شدن کل ژنوم، تکثیرتکراری ژن، گسترش در یک تبار خاص

* نویسنده مسئول، تلفن: 34424366-081؛ پست الکترونیکی:[email protected]

** نویسنده مسئول، تلفن: 44787362-021؛ پست الکترونیکی: [email protected]

مقدمه

 

ترپنوئید‌ها بزرگترین و متنوع‌ترین گروه متابولیتها در گیاهان می‌باشند. آنها در ساختار مولکولهای متنوعی مانند مولکولهای دفاعی، رنگدانه‌های فتوسنتزی و فیتوکرومها شرکت می‌کنند. همه ترپنوئیدها از واحدهای پنج کربنه ایزوپرن با نامهای؛ ایزوپنتیل دی فسفات (IPP) و دی متیل آلیل دی فسفات (DMAPP) تشکیل شده‌اند. در گیاهان IPP به وسیله مسیر موالونیک اسید (MVA) در سیتوسل تولید می‌شود. مسیر متیل اریترول فسفات (MEP) نیز IPP را در پلاستید‌ها تولید می‌نماید. بر اساس تعداد واحدهای ایزوپرنی که در ساختار ترپنوئیدها به کار رفته است، می‌توان آنها را به گروههای مختلفی تقسیم نمود. از جمله: همی‌ترپنوئیدها (C5)، منوترپنوئیدها (C10)، سزکوئی‌ترپنوئیدها (C15)، دی‌ترپنوئیدها (C20)، سزترترپنوئیدها (C25)، تریترپنوئیدها (C30)، تتراترپنوئیدها (C40) و پلی‌ترپنوئیدها با تعداد بیشتری از واحدهای ایزوپرون (11).

در مسیر بیوسنتز ترپنوئیدها آنزیمهای پرنیل‌ترانسفراز (PTs) در نقاط انشعاب مسیر فعالیت می‌نمایند و نقش مهی در تولید ترپنوئیدهای مختلف دارند. از جمله این آنزیمها می‌توان به ژرانیل‌ژرانیل دی فسفات سنتاز  (GGPPS)اشاره نمود. این آنزیم با استفاده از فارنسیل‌ دی ‌فسفات (FPP) و IPP ژرانیل‌ژرانیل ‌دی فسفات (GGPP)، پیش مادۀ اصلی برای تولید بسیاری از ترپنوئیدها، را تولید می‌نماید. خانوادۀ GGPPS به طور گسترده‌ای در سلسلۀ گیاهان پراکنده شده‌اند و در مقایسه با سایر آنزیمهای پرنیل‌ترانسفراز عملکرد پیچیده‌ای دارند. در گیاهان تکامل‌یافته‌تر، معمولاً تعداد پارالوگهای این خانواده افزایش می‌یابد. این پارالوگها در اثر فرآیندهای مختلف مضاعف‌ شدن ژن ایجاد می شوند، مانند؛ مضاعف شدن کل ژنوم، تکثیر تکراری ژنها و مضاعف شدن قطعه‌ای (Block duplication) . در ادامه فرآیندهای تفکیک عملکرد (Subfunctionalization) و ایجاد عملکرد جدید  Neofunctionalization)) در ژنهای مضاعف‌ شده منجر به ایجاد تنوع بالایی در عملکرد و یا الگوی بیان ژن می شوند (5 و 30).

فرایند مضاعف شدن ژن یکی از پیش نیازهای اساسی برای ایجاد ژنهای جدید و گسترش خانوادۀ ژنی است. در طی فرآیند دو برابر شدن، یک کپی از ژن می‌تواند از انتخاب منفی Purifying selection)) رها شود و امکان تجمع موتاسیونها در آن افزایش یابد. حال اگر انتخاب طبیعی به نفع تکثیر ژنها عمل کند، گسترش آن خانوادۀ ژنی اتفاق می‌افتد (6 و 7). به نظر می‌رسد فرآیند‌ها‌ی تکثیر تکراری ژنها  نقش موثرتری در تکامل انتخابی داشته باشند. در مقایسه با فرآیندهای غیرتکراری (NTDs)، فرآیندهای تکثیر تکراری ژنها خزانه بزرگتری از تغییرات پایدار را ایجاد می‌نمایند. بنابراین، شانس بیشتری برای حضور در ژنهای مرتبط با پاسخ به تنشهای زنده دارند. از آنجا که هر گیاه تاریخچه و شرایط زندگی خاص خود را دارد، فشار انتخاب طبیعی در تبارهای مختلف گیاهان متفاوت خواهد بود. بنابراین، هنگامی که گروههای ارتولوگ در یک تبار در جهت پاسخ به شرایط محیطی خاص گسترش می‌یابند، معمولاً ژنهای پراساخت (paralogous) آنها در تبارهای دیگر تمایلی به حفظ شدن ندارند (13).

پدیده های ایجاد عملکرد جدید و تفکیک عملکرد در یک خانوادۀ پروتئینی از نتایج احتمالی واگرایی عملکردی می‌باشند که پس از رویداد تکثیر ژن رخ می‌دهند. ایجاد عملکرد جدید فرآیندی است که در طی آن عملکرد ژن اجدادی بین دوکپی جدید پراساخت تقسیم می‌شود. در مقابل، تفکیک عملکرد هنگامی رخ می دهد که یک کپی از ژن در اثر یک تکامل پرشتاب، عملکرد جدیدی را به دست می آورد و کپی دیگر عملکرد قبلی را حفظ می‌نماید (18). تنوع در جایابی پروتئینها  (PSL)می‌تواند منجر به ایجاد یک عملکرد جدید و یا تفکیک عملکرد شود. بنابراین، می‌تواند نقش مهمی در تکامل ژنومهای یوکاریوتی داشته باشد (3و22). تشخیص جایابی یک پروتئین در اجزای درون سلولی عملکرد بیولوژیکی آن آنزیم را تا حدود زیادی مشخص می کند و  بینش مناسبی از مسیر تکاملی خانوادۀ ژنی فراهم می‌آورد (33).

به دلیل نقش کلیدی آنزیمهای GGPPS در بیوسنتز ترپنوئیدها، در این تحقیق، روند تکاملی این خانواده در گیاهان بررسی گردید و نقش تغییرات مولکولی بر روی عملکرد و خصوصیات آنزیم مورد بررسی قرار گرفت. در این راستا فرآیندهای مضاعف شدن ژن در خانوادۀGGPPS  در بین گیاهان مطالعه شد. همچنین سهم فرآیندهای تکثیر تکراری ژنها و مضاعف شدن کل ژنوم در گسترش این خانوادۀ ژنی مورد بررسی قرار گرفت. در ادامه جهت بررسی تنوع تمرکز درون سلولی پروتئینها، از برنامه های پیشگویی جایابی درون سلولی (subcellular localization prediction ) استفاده شد. در نهایت، جهت تعیین نواحی مهم و تأثیرپذیر از نظر تکاملی، فشار انتخاب طبیعی بر روی اعضای این خانواده مورد بررسی قرار گرفت.

مواد و روشها

داده های توالی و همردیفی: توالی پروتئینی GGPPS در گیاه Arabidopsis thaliana (p34802)  از پایگاه دادۀ UniProt (http://www.uniprot.org/) انتخاب شد و از آن برای بازیابی دیگر توالیهای خانوادۀ  GGPPS در پایگاه دادۀ UniProtKB Vridiplantae استفاده شد. به این منظور، یک جستجوی PSI-BLAST با گنجاندن حد آستانه E value 10-6  انجام شد. همچنین توالیهایی که طول آنها از 30 درصد طول توالی مورد تقاضا کمتر و یا بیشتر بودند حذف شدند. در نهایت توالیهایی از 139 گونه مختلف گیاهی به دست آمد.

همردیفی توالیهای پروتئینی با استفاده از روش  MAFFT و با الگوریتم FFT-NS-I (20) در سرور GUIDANCE  (http://guidance.tau.ac.il) (27) صورت‌گرفت. در این سرور علاوه بر انجام همردیفی، امکان امتیاز‌دهی به همردیفیها وجود دارد و می‌توان نقاط دارای امتیاز همردیفی پایین را حذف نمود. روش MAFFT  در این سرور نسبت به سایر روشها از امتیاز همردیفی بالاتری ( امتیاز روش MAFFT 82/0 و امتیاز روشهای MUSCLE  و CLUSTALW به ترتیب (80/0 و 63/0 ) برخوردار بود. پس از انجام همردیفی ستونهایی که دارای امتیاز پایین‌تر از 70/0 بودند حذف شدند. در نهایت نتایج در نرم‌افزار BioEdit (14) نیز مورد اصلاح قرار گرفت.

تجزیه و تحلیل فیلوژنتیک: نتایج همردیفی برای بازسازی درخت فیلوژنتیکی بدون ریشه مورد استفاده قرار گرفت. به این صورت که ابتدا در نرم‌افزار ProtTest 3.0، مدل JTT+G+I به عنوان بهترین مدل تکاملی برای این مجموعه شناخته شد. سپس با استفاده از نرم‌افزار RaxML 3.0 (13)، رسم درخت به روش حداکثر درست‌نمایی (ML) صورت گرفت. جهت پشتیبانی آماری گره‌ها در درخت فیلوژنتیک، از روش بوت استرپ با 500 تکرار استفاده شد. در نهایت، مرحله ریشه‌دار نمودن درخت، در نرم‌افزار Notung 2.9 (4) انجام شد.

تجزیه و تحلیل فرآیند های مضاعف  شدن ژن و بررسی گسترش درخانواده پروتئینیGGPPS: به منظور تعیین درجه گسترش خانوادۀ پروتئینی، جستجوی گسترده ای در 51 ژنوم موجود در پایگاه دادۀ Phytozome http://www.phytozome.net)) (12) انجام شد  و توالیهای خانوادۀ پروتئینی GGPPS در آنها شناسایی شدند. بازسازی درخت فیلوژنتیک مطابق با روشی که در بخش قبل توضیح داده شد، صورت گرفت. همچنین، درخت گونۀ مرتبط با گونه­های مورد بررسی، براساس اطلاعات موجود در فیتوزوم ساخته شد. از نرم افزار Notung2.9 (4) جهت پی بردن به فرآیندهای از دست دادن و به دست آوردن ژن در طی فرآیند تکامل گیاهان استفاده شد. این فرآیندها به روش تلفیق درخت ژن و درخت گونه (Reconciliation)   و با استفاده از روش پارسیمونی مورد شناسایی قرارگرفتند. در اصل پارسیمونی فرض بر این است که فرآیندهای مضاعف شدن و از دست دادن ژن پدیده­های نادری می­باشند. بنابراین در نرم افزار Notung تنها در صورت عدم وجود اطلاعات از منابع تکاملی دیگر، از پدیده­های مضاعف شدن و از دست دادن ژن برای توضیح روابط فیلوژنتیکی استفاده می شود. به طوری که در نهایت حداقل پدیدۀ مضاعف شدن و از دست دادن ژن در فرآیند تکاملی دیده شود. جهت بررسی زمان تقریبی وقایع گسترش و انقباض در این خانوادۀ ژنی، درخت زمان مربوط به گونه های مورد مطالعه، با استفاده از اطلاعات موجود در پایگاه دادۀ  TimeTree (www.timetree.org/) (17) رسم شد. همچنین برای تعیین سهم فرآیند های مضاعف شدن تکراری و مضاعف شدن کل ژنوم در گسترش این خانوادۀ ژنی، از پایگاه دادۀ PLAZA (30) نیز استفاده شد.

بررسی جایابی پروتئینهای خانوادۀ GGPPS در سلول: جهت پیش‌بینی جایابی پروتئینهای خانوادۀ GGPPS در اندامکهای درون سلولی(PSL)  ، از توالی کامل پروتئینهای مورد مطالعه استفاده شد. در این بررسی توالیهایی که فاقد نواحی انتهایی بودند از مجموعه داده‌ها حذف شدند. در مرحله بعد، براساس پروتکل امانوئل‌سون و همکاران محل هدف‌گیری و جایابی پروتئینها در سلول با استفاده از  نرم‌افزار‌های   TargetP (9)، SignalP  (28) و CholoroP  (10) مورد تجزیه و تحلیل قرار گرفت. علاوه بر این، برای به دست آوردن نتایج دقیق‌تر، از نرم‌افزار LOCALIZER (31) نیز استفاده شد.

بررسی اثرانتخاب طبیعی مثبت: جهت بررسی اثر انتخاب طبیعی مثبت در خانوادۀ GGPPS در گیاهان، از برنامۀ CODEML در بستۀ نرم­افزاری PAML 4.8 (36) استفاده شد. به دلیل واگرایی زیاد ژنها در درخت فیلوژنی، توالیهایی از چهار زیرگروه گیاهان آبزی، بازدانگان، گیاهان تک­لپه وگیاهان دو­لپه­ای انتخاب شده و به طور جداگانه مورد بررسی قرار گرفتند. در هر گروه، همردیفی چندگانۀ کدونهای مرتبط با توالیهای اسیدآمینه­ای در نرم افزار تحت وب PAL2NAL (http://www.bork.embl.de/pal2nal/) انجام شد. همچنین، درخت فیلوژنی با استفاده از همردیفی چندگانۀ پروتئینها و با روش حداکثر درست­نمایی در نرم­افزار MEGA­6   بازسازی شد.

فشار انتخاب طبیعی با مقایسۀ نرخ جایگزینی غیرمترادف (dN) به نرخ جایگزینی مترادف (dS) مورد بررسی قرار گرفت. در این روش، اگر یک ژن دارای تکامل خنثی باشد، نسبت dN  به dS (ω) برابر با 1 خواهد بود. هنگامی­که ω>1 باشد، ژن انتخاب طبیعی مثبت را تجربه می­نماید. همچنین، ω<1 به­معنی وجود انتخاب منفی می­باشد. در این بررسی از روشهای مبتنی بر حداکثر درست نمایی (ML) برای تعیین فشار انتخاب طبیعی استفاده شد. ابتدا به منظور بررسی متغییر بودن ω  در بین جایگاهها، مدل M0 با مدل M3 مورد مقایسه قرار گرفت. در مدل M0 فشار انتخاب طبیعی در تمام جایگاهها یکسان در نظر گرفته می­شود. در حالی که در مدل M3 فرض بر این است که فشار انتخاب طبیعی در بین جایگاهها متفاوت می­باشد. در مرحلۀ بعد، جهت مشخص نمودن جایگاههای انتخاب طبیعی مثبت، مدل M1a با مدل M2a ومدل M7 با M8 مقایسه شدند. مدلهای M1a, M0 وM8 به عنوان فرض صفر درنظر گرفته شدند و از آزمون نسبت درست­نمایی (LTR) جهت یافتن بهترین مدل برای داده­ها استفاده شد. سطح معنی­داری در این مطالعه 05/0 در نظر گرفته شد.

نتایج و بحث

آنالیز فیلوزنتیک: بررسی درخت فیلوژنتیک نشان داد که تمام هومولوگهای گیاهان آبزی یک کلاد مونوفیلتیک را تشکیل می­دهند که در شکل1 به عنوان SubA نشان داده شده است. با این حال، تبارهای دیگر ( آنزیمهای GGPPS متعلق به گیاهان خشکی‌زی) تشکیل چندین زیرگروه را داده اند که شامل زیرگروههای B، C، D، E، F، G و H  می­باشند (شکل1). اعضای زیرگروه B متعلق به گیاهان غیرگلدار مانند قارچها و گیاهان آوندی اولیه می­باشند. هومولوگهای GGPPS متعلق به زیرگروه C به طور عمده در گیاهان نهاندانه یافت شد، و فقط یک هومولوگ متعلق به گیاهان بازدانه (Picea sitchensis) در این گروه مشاهده شد. آنزیمهای متعلق به زیرگروه C به عنوان زیر واحد کوچک (SSUs) مستند سازی شدند. این گروه از آنزیمها می توانند توزیع شار IPP را بین ترکیبات GPP و GGPP در گیاهان کنترل کند. سطح بیان این ژن در بافتهای مختلف و در شرایط مختلف محیطی و تکاملی گیاه تغییر می کند و به این ترتیب تولید GPP و GGPP کنترل می شود (7 و26).  به نظر می رسد ایجاد چنین آنزیمهایی یک مزیت انتخابی برای گیاهان گلدار است تا آنها بتوانند GGPP یا GPP به طور بهینه تولید کنند. اعضای زیرگروه D متعلق به بازدانگان می­باشند. پارالوگهای این گروه می توانند انواع مختلفی از پرنیل ترانسفرازها، از جمله GPP، GGPP یا G / GGPP تولید کنند. هومولوگهایGGPPS  متعلق به زیرگروه E بیشتر در نهاندانگان دیده می شوند. این گروه خود به زیرگروههای کوچکتر تقسیم می شود، در میان این زیر شاخه ها می توان به E2 و E3 اشاره نمود. آنزیمهایGGPPS مربوط به E2 به طور انحصاری در آستریدها (Asterids) یافت می­شوند و به عنوان زیرواحدهای بزرگ (GGPPS-LSU)  مستندسازی شدند. آنزیمهایLSU  نقش مهمی در تنظیم GPP ایفاء می کند که یک پیش مادۀ اصلی برای مونوترپنها می­باشد (16 و 26). بنابراین، دسترسی مؤثرتری به مونوترپنها را فراهم می کنند .مونوترپنها در دفاع از گیاه، گرده افشاندن و پراکندگی بذر دخالت می کنند. به نظر می‌رسد حضور هترودایمرها در آسترید­ها یک مزیت انتخابی برای تولید گردۀ کارآمدتر می­باشد. هومولوگهای زیرگروه E3 متعلق به خانوادۀ Brassicaceae می­باشند و گسترش در یک تبار خاص (LES) در آنها مشاهده می­شود. هومولوگهای زیرگروه F که در تک‌لپه­ایها و دولپه­ایها دیده می­شوند؛ محصولی کاملا متفاوت از گروههای دیگر تولید می­نمایند. این آنزیمها به عنوان Polyprenyl Pyrophosphate Synthase  مستندسازی شدند (5). زیرگروه G متعلق به تک‌لپه‌ایها می­باشد. در حالی که نزدیکترین گروه به آن یعنی زیرگروه H تنها در دولپه­ایها یافت می­شود و شواهد تجربی نشان می­دهد که این گروه منحصراً GGPP تولید می­کند (5).


 

شکل1- درخت فیلوژنتیک ریشه­دار شده متعلق به خانوادۀ GGPPS در گیاهان: بوت استرپها با نقاط رنگی به نمایش گذاشته شده­اند. نقاط قرمز رنگ بوت استرپهای بین 8/0 تا 1، نقاط زرد رنگ بوت استرپ 4/0 تا 8/0 و نقاط خاکستری بوت استرپهای  4/0 => را نشان می­هند. زیرگروههای A,B,C,D,E,F,G,H با رنگهای مختلف نمایش داده شده­اند.

 

جهت فهم بهتر نقش تغییرات مولکولی در تکامل هومولوگهای GGPPS، ساختار نگاره­های مهم و عملکردی در این خانوادۀ آنزیمی مورد بررسی قرار گرفت. یکی از مهم ­ترین نواحی مورد بررسی در دومین ساختاری GGPPS دو ناحیۀ غنی از آسپارتات می­باشد. نخستین ناحیۀ غنی از آسپارتات که با نام FARM شناخته می­شود، دارای توالی DDxxxxD می باشد. دومین ناحیۀ غنی از آسپارتات با نام SARM شناخته می­شود و توالی آن به صورت DDxxD می باشد. این نواحی برای اتصال سوبسترا به آنزیم ضروری می باشند. بررسی نواحی غنی از آسپارتات در توالیها نشان داد که نخستین نگارۀ غنی از آسپارتات (FARM) ناحیۀ بسیار حفاظت شده­ای است. در حالی که دومین نگارۀ غنی از آسپارتات (SARM) از حفاظت­شدگی کمتری برخوردار است. هومولوگهای گروهC که به عنوان آنزیمهای زیرواحد کوچک در هترودایمر­ها (SSUs) شناخته می شوند، فاقد نگارۀ SARM می­باشند. این ناحیه جهت عملکرد آنزیم بسیار ضروری می­باشد، لذا این آنزیمها به تنهایی قادر به فعالیت نمی­باشند اما در ساختار کمپلکس هترودایمر G(G)PPS شرکت می­نمایند و تولید محصول را به سمت سنتز GPP سوق می­دهند. از آنجا که این آنزیمها به طور گسترده­ای در گیاهان گلدار یافت شدند، احتمالاً موتاسیونهایی که منجر به ایجاد چنین آنزیمهایی شده است در مراحل اخیر تکاملی اتفاق افتاده­اند و منجر به تولید بهینه­تر ترپنوئید­ها شده­اند.

یکی دیگر از نواحی مهم مورد بررسی دو نگارۀ CxxxC می­باشد. این نواحی برای اتصال زیرواحدها در آنزیمهای هترودایمر G(G)PPS ضروری می­باشند. در بررسی توالیها مشخص شد که هومولوگهای گروه  A و B فاقد یک یا هردو نگارۀ CxxxC می­باشند. اما ازآنجا که برخی از هومولوگها در گیاهان آبزی (SubA) دارای یکی از این موتیفها می­باشند، می­توان چنین استنباط نمود که این نگاره در مراحل اولیه تفرق گیاهان وجود داشته و در طی فرآیند تکامل برخی از هومولوگها براساس نیاز خود این کپی از نگاره را ازدست داده اند و یا یک کپی دیگر از آن را به دست آورده­اند. هومولوگهایی که در گروه D  دسته بندی شده­اند، به طور کلی در بازدانگان یافت می­شوند. در همۀ این هومولوگها نخستین نگارۀ CxxxC یافت می­شود، ولی دومین نگاره به شکل CxxxS تغییر شکل داده است. آنزیمهایی با چنین ساختار دارای عملکرد دوگانه می­باشند و قادر به تولید هر دو مادۀ  GGPPو GPP می­باشند. چنین عملکردی سبب تولید بهینۀ مونوترپنها و دی­ترپنها در بازدانگان می­شود. در زیرگروه C هر دو نگارۀ CxxxC وجود دارد. این گروه از آنزیمها به تنهایی قادر به فعالیت نمی­باشند و وجود این نگاره­ها برای فعالیت آنها ضروری می­باشد. در مقابل، هومولوگهای گروه F که محصولات با طول زنجیره بلند (25 تا 45 کربنه) تولید می­نمایند، هر دو نگارۀ CxxxC را از دست داده­اند. تمام هومولوگهای گروههای E  و F فقط دارای نخستین نگارۀ CxxxC می­باشند (شکل 2). به طور کلی، در این نواحی تفاوت قابل ملاحظه­ای بین هترودایمر­ها و همودایمر­ها مشاهده نشد. این نتایج مشخص نمود که ناحیۀ CxxxC برای اتصال دو زیرواحد ضروری است ولی کافی نیست.

 

 

شکل2 – تکامل مولکولی ناحیۀ عملکردی پلی­پرنیل سنتاز: حضور و یا عدم حضور هر نگاره در هر یک از زیرگروهها با علامت مشخص شده است، و محصول نهایی تولید شده در هر یک از زیرگروهها با علایم اختصاری بیان شده است. این محصولات شامل؛ ژرانیل ژرانیل دی فسفات سنتاز (GGPP)، ژرانیل دی فسفات سنتاز (GPP) و سولانسیل دی فسفات سنتاز .(PPP)

بررسی روند گسترش و انقباض در خانوادۀ GGPPS: میزان پدیدۀ مضاعف شدن ژنها در گیاهان بسیار بیشتر از سایر گونه‌های یوکاریوتی می‌باشد. به کمک این پدیده مواد اولیه برای تکامل گونه‌ها فراهم می‌شود. در نتیجه گیاهان قادر خواهند بود تا سازگاری بهتری در برابر تغییرات محیطی داشته باشند (31). فرآیندهای مضاعف شدن کل ژنوم  و تکثیر تکراری ژنها  نقش مهمی در گسترش خانواده‌های پروتئینی در گیاهان دارند. فرآیند مضاعف شدن کل ژنوم  یکی از مکانیسمهای مهم در تکثیر ژنها است، که سبب افزایش ناگهانی تعداد ژنها در خانواده‌های پروتئینی می‌شود. در مقابل، فرآیند تکثیر تکراری ژنها اغلب سبب گسترش درخانواده‌های پروتئینی‌ای می‌شود که در پاسخ به استرس و محرکهای محیطی نقش دارند. علاوه براین، فرآیندهای تکثیر تکراری ژنها در طی یک نسل دارای فراوانی بالایی هستند. در نتیجه، احتمال بیشتری وجود دارد تا در ژنهای مرتبط با استرس مشاهده و حفظ شوند. در واقع می‌توان گفت که فرآیندهای تکثیر تکراری ژنها در مقایسه با فرآیندهای دیگر باعث به وجود آمدن تنوع بیشتری در خزانه ژنتیکی یک موجود می شوند و از این رو اهداف مناسبی برای انتخاب به حساب می آیند (15 و 32). با توجه به مطالب ذکر شده، برای شناخت کامل خانوادۀ GGPPS باید درک صحیحی از وقایع مضاعف شدن ژن در این خانوده در طول فرآیند تکامل وجود داشته باشد.

در بررسیهای صورت گرفته بر روی خانوادۀ GGPPS، ناسازگاری بین درخت ژنی و درخت گونه نشان داد که تاریخچۀ تکاملی خاصی در این خانواده وجود دارد. در این مطالعه مشخص شد که در طی فرآیند تکامل، خانوادۀ GGPPS یک خانوادۀ در حال گسترش را در تبارهای مختلف گیاهی شکل داده است. این خانوادۀ ژنی حدود 80 فرآیند مضاعف شدن ژن و 217 فرآیند از دست دادن ژن را در طی روند تکامل گیاهان تجربه نموده است (شکل 1). و در همان مراحل اولیه تفرق فرآیند مضاعف شدن ژنها منجر به افزایش در تعداد نسخه‌های ژنی در گیاهان شده‌است. به طوری که، رابطه مستقیمی بین پیچیدگی یک گونۀ گیاهی وتعداد پارالوگهای GGPPS در آن گونه مشاهده می‌شود. علاوه بر اینها مشاهده می‌شود که فرآیندهای مضاعف شدن ژن در این خانواده باعث گسترش در یک تبار خاص (LSE)  شده است، که از جمله مهمترین آنها می‌توان به LSE در خانوادۀ Brassicaceae اشاره نمود (شکل4). در مطالعاتی که کومن و همکاران بر روی تکامل این خانوادۀ پروتئینی انجام دادند نیز به این امر اشاره شده است (5).

تلفیق درخت ژن و درخت گونه نشان می دهد که جدیدترین جد مشترک (MRCA) در گیاهان تنها دارای یک کپی از ژن GGPPS بود ( شکل 3و 4). اما در طی فرآیند تکامل، این ژن با نرخ گسترش متفاوتی در چندین مرحله مضاعف شده است. این بررسی نشان می‌دهد که در جلبکهای آبی‌سبز و در گیاهان خشکی‌زی اولیه تنها یک کپی از ژن GGPPS وجود داشته است. در حالی که در همان مراحل ابتدایی تکامل گیاهان و درست پس از جدایی بروفیتها، در MRCA تک­لپه­ایها و دولپه‌ایها 5 فرآیند مضاعف شدن ژن در خانوادۀ  GGPPSاتفاق افتاده است. این روند گسترش پس از جدایی تک­لپه­ایها و دولپه‌ا‌یها نیز ادامه داشت. به طوری که در حدود 145 میلیون سال پیش، شاهد گسترش قابل ملاحظه‌ای در MRCA گیاهان تک‌لپه می توان بود و پس از آن فرآیندهای پی‌درپی از دست دادن ژن و در نتیجه انقباض آنزیمهای  GGPPSدر تک­لپه­ایها به وقوع پیوسته است.

از میان گیاهان تک­لپه تنها ذرت ( (Zea maysدر فرآیندهای اخیر تکاملی، گسترش در این خانوادۀ ژنی را تجربه نموده است. از سوی دیگر در گیاهان دو‌لپه نیز این فرآیند گسترش تا حدود 117 میلیون سال پیش ادامه داشت.

 

 

شکل3- درخت فیلوژنیک ریشه دار شده متعلق به خانوادۀ GGPPS در گیاهان: وقایع مضاعف شدن به صورت نقاط قرمز در گره ها نمایش داده شده است و اعداد نشان دهندۀ بوت استرپ می باشند (بوت استرپهای زیر 90 نشان داده نشده‌اند).

 

اما فرآیند‌های مکرر از دست دادن ژن که پس از آن به وقوع پیوسته، نشان می دهد که اغلب این کپیهای جدید ژنی، قادر به ادامه بقا نبوده و در طی فرآیند تکاملی در اثر انتخاب طبیعی حذف شده‌اند . با این حال از حدود 70 تا 80 میلیون سال قبل فرآیند گسترش آنزیمهای GGPPS دوباره در برخی از تبارها مشاهده می‌شود. برخی از این گسترشها پس از فرآیندهای گونه زایی رخ داده‌اند. این امر می‌تواند نشان دهندۀ نیاز این گونه‌ها به آنزیمهایGGPPS  تخصصی برای پاسخگویی به شرایط خاص محیطی باشد (شکل4و5). باید توجه داشت که اغلب فرآیندهای گسترش آنزیمهای GGPPS از نظر زمان وقوع با رخدادهای پلی‌پلوئیدی همخوانی دارند (شکل5).

این بدان معناست که اغلب کپیهای ژن در این خانواده در اثر فرآیندهای مضاعف شدن کل ژنوم به دست آمده‌اند. این نتایج با نتایج بررسی در پایگاه دادۀ PLAZA مطابقت دارد (جدول1). این مطالعه نشان داد که فرآیندهای مختلف مضاعف شدن ژن به گسترش خانوادۀ GGPPS کمک نموده‌اند و به طور کلی پدیده‌های غیر تکراری (NTD) سهم بیشتری در گسترش این خانواده داشته‌اند و این پدیده در تک‌لپه­ایها مشهودتر است. با این وجود در مواردی که فرآیندهای مضاعف شدن منجر به LSE شده است، نقش فرآیندهای تکثیر تکراری ژنها پررنگ‌تر می‌شود. خانوادۀ Brassicaceae مثالی بر این مدعا است (شکل4).

 

 

شکل4- گسترش خانوادۀ GGPPS در طی فرآیند تکامل گیاهان: فرآیندهای به دست آوردن ژن در صورت کسر و فرآیندهای از دست دادن ژن در مخرج کسر بر روی شاخه های درخت نمایش داده شده‌اند. تعداد کپیهای ژن در هر گونه و در اجداد مشترک گونه ها در داخل دایره به رنگ زرد نشان داده شده‌اند .

 

این نتایج تا حدودی با نتایجی که در مطالعات قبلی به دست آمده مطابقت دارد. دراین مطالعات مشخص شده که ژنهای دخیل در تنشهای زیستی عمدتاً در یک تبار خاص قادر به بقا می باشند و اغلب از طریق فرآیندهای تکثیر تکراری ژنها گسترش می‌یابد (15).

بررسی تنوع جایابی پروتئینهای خانوادۀ GGPPS در سلول: به منظور تشخیص فرآیندهای گسترشی که منجربه تغییر در عملکرد شده‌اند، تنوع PSL در این خانواده مورد بررسی قرارگرفت.  تغییر در محل  جایابی پروتئین در درون سلول  (PSL)یکی از منابع مهم بقا و تنوع عملکرد در خانواده‌های پروتئینی است. فرآیند PSL می‌تواند باعث بهبود عملکرد پروتئینها شود و مزایایی را برای جاندار به ارمغان آورد (1). علاوه بر اینها، تشخیص صحیح جایگاه جایابی پروتئین در درون سلول می‌تواند به تشخیص عملکرد آن پروتئین و مسیر بیولوژیکی که در آن فعالیت می کند کمک نماید (29). از این رو، پیشگویی جایابی پروتئین در داخل سلول در تحقیقات تکاملی بسیار مورد توجه است.

 

 

شکل 5- تطبیق فرآیندهای گسترش و انقباض در خانوادۀ GGPPS با درخت زمان در گونه های مورد بررسی (بر حسب MYA). فرآیندهای گسترش به صورت پررنگ و فرآیندهای انقباض به صورت خط چین نمایش داده شده‌اند.

جدول 1- سهم انواع فرآیندهای مضاعف  شدن در گسترش خانوادۀ GGPPS

 

سهم انواع فرآیند‌های مضاعف شدن

گونه‌های گیاهی

%No

%Block

%Tandem

%Tandem & Block

Green algae:

 

 

 

 

Chlamydomonas reinhardtii

100

0

0

0

Ostreococcus lucimarinus

100

0

0

0

Bryophytes:

 

 

 

 

Physcomitrella patens

0

100

0

0

Monocots:

 

 

 

 

Zea mays

20

80

0

0

Sorghum bicolor

100

0

0

0

Setaria italica

100

0

0

0

Oryza sativa

100

0

0

0

Brachypodium distachyon

100

0

0

0

Dicots:

 

 

 

 

Arabidopsis thaliana

50

33/8

25

66/16

Arabidopsis lyrata

50

20

0

30

Capsella rubella

0

85/42

14/57

0

Brassica rapa

33/13

60

33/13

33/13

Carica papaya

100

0

0

0

Gossypium raimondii

76/30

76/30

38/15

07/23

Theobroma cacao

50

0

50

0

Citrus sinensis

60

0

40

0

Eucalyptus grandis

60

0

40

0

Prunus persica

100

0

0

0

Fragaria vesca

100

0

0

0

Medicago truncatula

33/33

66/66

0

0

Glycine max

60

40

0

0

Ricinus communis

100

0

0

0

Manihot esculenta

33/33

66/66

0

0

Populus trichocarpa

57/28

85/42

0

57/28

Vitis vinifera

33/33

66/66

0

0

Solanum lycopersicum

86/42

28/14

0

86/42

Solanum tuberosum

86/42

28/14

0

86/42

     Source: PLAZA (https://bioinformatics.psb.ugent.be/plaza/)


از آنجا که آنزیمهایی که از IPP به عنوان سوبسترا استفاده می‌کنند در اندامکهای مختلف سلول پراکنده‌اند، منطقی به نظر می‌رسد که آنزیمهای GGPPS نیز در اندامکهای مختلف سلولی مانند کلروپلاست و میتوکندری و یا دستگاه گلژی تجمع یابند (21). مطالعاتی که پیش از این صورت گرفته این فرضیه را تأیید می‌نماید (21 ،27و37). در این مطالعه نیز، تداوم و اهمیت PSL در گسترش خانوادۀ GGPPS مورد مطالعه قرار‌گرفت.

آنالیزهای PSL انجام‌ شده بر روی توالیهای خانوادۀ GGPPS ، نشان داد که تقریباً تمامی این توالیها دارای پپتیدهای انتقالی می‌باشند. در این آنالیزها ناحیۀ هدف کلروپلاستی، میتوکندریایی و یا شبکۀ آندوپلاسمی در توالیها شناسایی شد. این بدان معناست که برخی از اندامکهای درون سلولی GGPP را خود تولید می‌نمایند. همانطور که انتظار می‌رفت، اغلب توالیها دارای ناحیۀ هدف کلروپلاستی بودند (cTP) (شکل6). آنزیمهایGGPPS  فوق می‌توانند در بیوسنتز ایزوپرنوئیدهایی مانند کارتنوئیدها، کلروفیل‌ها و ای‌ان‌تی-کارنو همچنین بیوسنتز برخی از متابولیتهای ثانویه مانند تاکسول شرکت نمایند (16) . تعدادی از توالیها دارای ناحیۀ هدف میتوکندریایی بودند (mTP) (شکل6). این آنزیمها در بیوسنتز ایزوپرنوئید ‌کوئینون شرکت می‌کنند. این ماده به عنوان یک ناقل الکترون در زنجیرۀ انتقال الکترون بسیار ضروری است (25). آنزیمهای با ناحیۀ هدف میتوکندریایی اغلب در خانوادۀ Brassicaceae مشاهده شدند. اما در مورد پپتیدهای سیگنالی پیشگوییهای متفاوتی وجود داشت. نرم‌افزار TargetP که می‌تواند سیگنال پپتیدها را با دقت و حساسیت بالایی تشخیص دهد و همچنین نرم‌افزار LOCALIZER توانستند ناحیۀ پپتیدهای سیگنالی را در برخی از توالیهای خانوادۀ Brassicaceae مشخص نمایند، ولی SignalP نتوانست هیچ سیگنال پپتیدی را شناسایی نماید (شکل6). آنزیمهایی که دارای سیگنال پپتید (SP) می‌باشند در واکنشهای پرنیلاسیون پروتئین شرکت می‌کنند، که در مسیرهای پیام­رسان بسیار مهم است. بر اساس این مشاهدات، جایابی در شبکۀ آندوپلاسمی و میتوکندری در این خانوادۀ پروتئینی یک پدیدۀ نادر است، اما در طی تکامل گیاهان، در برخی از تبارها، آنزیمهای GGPPS برای شرکت در مسیرهای متابولیکی خاصی تکامل یافته‌اند. این پدیده به ویژه در خانوادۀ Brassicaceae که در فرآیندهای اخیر تکاملی دچار LSE شده ، بیشتر قابل مشاهده است. اما به طور کلی، PSR نقش کوچکی در ایجاد تنوع عملکردی در ژنهای تکثیر شده در این خانواده دارد.

 

 

شکل6- بررسی جایابی درون سلولی پروتئینهای خانوادۀ GGPPS در گیاهان با استفاده از نرم افزارهای LOCALIZER(ستون داخلی)، TargetP (ستون دوم)، CholoroP (ستون سوم) و  SignalP(ستون چهارم).نتایج هر نرم‌افزار به صورت ستونهایی با نقاط دایره ای شکل نمایش داده شده است.cTP  (دایرۀ توپر سبز رنگ)،  mTP ( دایرۀ توپر آبی رنگ)، SP (دایرۀ توپر ارغوانی رنگ)، Others (دایرۀ توپر صورتی رنگ)، No cTP (دایرۀ سبز رنگ توخالی)، NO SP (دایرۀ ارغوانی توخالی).


بررسی فشار انتخاب طبیعی در خانوادۀGGPPS  در گیاهان: میانگین ω در هر گروه نشان داد که فشار انتخاب طبیعی در رده­های مختلف گیاهان به طور قابل توجهی متفاوت است. از آنجا که میانگینω در تمام گروهها بسیار پایین بود، به نظر می­رسد که خانوادۀ GGPPS در گیاهان به شدت تحت تأثیر انتخاب طبیعی منفی قرار دارد. اما باید توجه داشت که ممکن است انتخاب طبیعی مثبت به صورت محدود در برخی از کدونها اتفاق افتاده باشد. همچنین، مقایسۀ مدلهای M3 وM0 نشان داد که در تمام گروهها ω  به صورت غیریکنواخت درطول توالیها توزیع شده است (جدول2). بنابراین، آزمونهای تخصصی بیشتری که تنوع بین جایگاهها را بررسی می­کنند، مورد آزمایش قرار گرفتند. در این آزمونها مدل M2a  با مدل M1a و مدل M8  با مدل M7 مورد مقایسه قرار گرفت. آزمون نسبت درست­نمایی (LRT) فقط در گروه بازدانگان وجود جایگاههایی با انتخاب طبیعی مثبت را تأیید نمود (جدول2). سپس این جایگاهها با استفاده از روش بیزین (BEB) مورد شناسایی قرار گرفتند. در گروه بازدانگان 6 جایگاه با احتمال پسین (posterior probability ) بالاتر از 95 درصد به عنوان جایگاههای انتخاب طبیعی مثبت شناسایی شدند (جدول2). تمامی این نقاط در ناحیۀ انتهای آمینی قرارگرفته اند. ناحیۀ انتهای آمینی (حدود 70 تا90 اسیدآمینه) در خانوادۀ GGPPS مسئول جایابی درون سلولی (subcellular localization) می­باشد. این نتایج نشان می­دهد که عملکرد جایابی درون سلولی در بازدانگان تاحدودی تحت تأثیر انتخاب طبیعی مثبت قرار دارد.

 

جدول2- خلاصۀ نتایج بررسی فشار انتخاب طبیعی در خانوادۀ GGPPS با استفاده از مدلهای مبتنی بر جایگاه.

زیرگروه­ها

مدل­ها

ارزیابی

پارامتر­ها

لگاریتم درست­نمایی (InL)

آزمون نسبت درست­نمایی (LRT)

جایگاه­های انتخاب طبیعی مثبت

گیاهان آبزی:

 

 

 

 

 

 

M0

01673/0=ω

930018/7290-

 

 

M3

p0=13471/0 , p1=34769/0 ,  p2=33810/0 , p3=17328/0, p4= 00622/0, ω0=00002/0, ω1=00211/0, ω2=02109/0, ω3=06553/0, ω4=27229/0

038688/7287-

78266/7 *

 

M1a

p0=97277/0, p1=02723/0, ω0=01605/0,ω1=00000/1

303740/7262-

 

 

M2a

p0=97277/0, p1=02723/0, p2=00000/0, ω0=01605/0, ω1=00000/1, ω2=03154/103

303740/7262-

00000/0

 

M7

p=42787/0, q=86916/19

659887/7066-

 

 

M8

p0=99999/0, p=42789/0, q=87167/19, (p1=00001/0), ω=00000/1

660678/7066-

000791/0

 

بازدانگان:

 

 

 

 

 

 

M0

ω= 33063/0

004475/7764-

 

 

M3

p0=466676/0, p1=34016/0, p2=04318/0, p3=07556/0, p4=\=07433/0, ω0=05163/0, ω1=41078/0, ω2=41433/0, ω3=42129/1, ω4=42130/1

102786/7473-

803378/581 *

 

M1a

p0=68769/0,p1=31231/0, ω0=11828/0, ω1=00000/1

213895/7488-

 

 

M2a

p0=68370/0, p1=29054/0, p2=02576/0, ω0=12203/0, ω1=00000/1, ω2=30377/2

501626/7485-

424538/5 *

Y10, F23, S24, G51, V52, G56

M7

p=36675/0, q=69355/0

765137/7574-

 

 

M8

p0=87572/0, p=59702/0, q=86400/1, (p1=12428/0), ω=49792/1

524617/7561-

48104/26 *

Y10, F23, S24, G51, V52, G56,

گیاهان تک­لپه:

 

 

 

 

 

 

M0

ω=19267/0

209262/5095-

 

 

M3

p0=12837/0, p1=22791/0, p2=29133/0, p3=18791/0, p4=16447/0, ω0=00471/0, ω1=05651/0, ω2=05651/0, ω3=12783/0,ω4=19479/0

489181/4900-

440162/389  *

 

M1a

p0=98880/0,p1=01120/0, ω0=08023/0, ω1=00000/1

412511/4932-

 

 

M2a

p0=98880/0,p1=01120/0,p2=00000/0 ω0=08023/0, ω1=00000/1, ω2=89826/19

412511/4932-

00000/0

 

M7

p=40207/1, q=60527/14

169857/4901-

 

 

M8

p0=99999/0, p=28423/1, q=08706/13, (p1=00001/0), ω=23577/156

361154/4901-

00000/2

 

گیاهان دولپه:

 

 

 

 

 

 

M0

ω=11252/0

066181/9352-

 

 

M3

p0=34323/0, p1=34000/0, p2=23065/0, p3=06716/0, p4=01896/0, ω0=01278/0, ω1=08890/0, ω2=19133/0, ω3=41682/0, ω4=76626/0

107542/9188-

91727/327 *

 

M1a

p0=93750/0,p1=06250/0, ω0=09552/0, ω1=00000/1

845174/9248-

 

 

M2a

p0=93750/0,p1=04142/0,p2=021109/0, ω0=09552/0, ω1=00000/1, ω2=00000/1

845174/9248-

00000/0

 

M7

p=63995/0, q=25978/4

943578/9192-

 

 

M8

p0=99999/0, p=63995/0, q=25978/0, (p1=00001/0), ω=80427/16

945338/9192-

00352/0

 

    LRT=2∆InL

     *  P value < 0.05


نتیجه گیری کلی

این مطالعه نشان داد که خانوادۀ GGPPS در گیاهان یک خانوادۀ در حال گسترش می باشد. همچنین مشخص شد، فرآیندهای مختلف مضاعف شدن از جمله فرآیندهای مضاعف شدن کل ژنوم و تکثیر تکراری ژنها در این گسترش نقش عمده‌‌ای دارند. به طور کلی، فرآیند مضاعف شدن کل ژنوم به ویژه در مراحل ابتدایی تکامل سهم بیشتری در این گسترش داشته است. اما فرآیند تکثیر تکراری ژنها در پدیده‌های LSE بیشتر مشاهده می‌شود.

پدیدۀ گسترش در این خانواده کمک می­کند تا گیاهان بتوانند به‌ صورت تخصصی­تر به تولید ترپنوئیدها بپردازند. ترپنوئیدها در طیف وسیعی از گیاهان یافت شده (1) و اغلب در پاسخ به شرایط محیطی نقش دارند. گسترش در آنزیمهای  GGPPS، این خانواده را به یک خانوادۀ بسیار انعطاف‌پذیر در سازگاری با شرایط محیطی تبدیل نموده است. از آنجا که گونه‌های پیچیده‌تر نیاز به پاسخهای سریعتر و تخصصی‌تر به تغییرات محیطی دارند، منطقی به نظر می رسد که تعداد کپیهای GGPPS در این گونه‌ها افزایش یابد، چراکه با افزایش تعدادکپیهای ژن، هر کپی قادر خواهد بود تا عملکرد اختصاصی­تری داشته باشد. به بیان دیگر، فشار انتخاب طبیعی که به وسیلۀ شرایط محیطی به گیاهان تحمیل شده است، باعث گسترش در خانوادۀ GGPPS  در گیاهان شده است.

بررسیهای فشار انتخاب طبیعی نشان داد که آنزیمهای GGPPS در گیاهان به طورکلی تحت تأثیر انتخاب طبیعی منفی (purifying selection) قرار دارند. باید توجه داشت­که تفکیک عملکرد (subfunctionalization) در این خانوادۀ پروتئینی به وفور یافت می­شود. لذا وجود انتخاب طبیعی منفی در این خانواده می تواند در اثر وقوع تفکیک عملکرد سریع درست بعد از وقایع مضاعف شدن ژن باشد. در این حالت بقای هر دوکپی برای حفظ عملکرد ژن اجدادی لازم است و هیچ­کدام از کپیها نمی­توانند به مدت بسیار طولانی تحت تأثیر موتاسیونها قرار بگیرند و از فشار انتخاب طیبیعی رهایی یابند (35).

آنالیزهایی که برروی PSL انجام شد، نشان داد که اغلب توالیهای مورد مطالعه دارای منطقه هدف‌گیری کلرپلاستی بودند، اما در طول گسترش این خانواده، گاهی هدف‌گیری میتوکندریایی یا ER در آنزیمهای GGPPS رخ داده است. بنابراین، می‌توان نتیجه گرفت که این پروتئینها برای تولید متابولیتهای خاصی، اختصاص داده شده­اند. به عبارت دیگر، PSR تا حدودی موجب تنوع عملکردی در این خانوادۀ پروتئینی شده است. بنابراین در مطالعات عملکردی این امر می‌تواند مورد توجه قرار گیرد. همانطور که در برخی از مطالعات نیز  بحث شده است، بررسی تنوع در جایابی پروتئین در درون سلول می‌تواند در مطالعات مهندسی‌ ژنتیک و متابولیک مفید باشد (8 ،19 ، 23،  24و34). همچنین، باید توجه داشت که آگاهی از دومینهای عملکردی  و مهم  نقش کلیدی در ایجاد سازه­های جدید و مهندسی پروتئین و به طورکلی مطالعات عملکردی دارد، لذا امروزه توجه فراوانی به این امر وجود دارد و تحقیقات گسترده­ای در این مورد صورت می گیرد که از جملۀ آنها می­توان به تحقیق جلیلی منش و همکاران اشاره نمود (2).

1- بختیاری. ن و احمدزاده. س. (1397). اورسولیک اسید: تری­ترپنوئید 5 حلقۀ­ای موجود در پوست سیب با طیف گسترده­ای از اثرات درمانی. مجلۀ پژوهش­های سلولی و مولکولی. تحت چاپ.
2- جلیلی منش, م, حداد مشهدریزه, ع, مخدومی, ع, حسین دخت, م. ر. (1397). ارزیابی ویژگی‌های ساختاری وعملکردی مجموعه پروتئینی Xpt به منظور توسعه‌ روش‌های مولکولی در طراحی نسل جدید آفت کش ها, مجله پژوهش‌های سلولی و مولکولی. تحت چاپ.
 
3- Byun, S. A. and Singh, S. 2013. Protein subcellular relocalization increases the retention of eukaryotic duplicate genes. Genome biology and evolution, 5(12): 2402-2409.
4- Chen, K., Durand, D. and Farach-Colton, M. 2000. NOTUNG: a program for dating gene duplications and optimizing gene family trees. Journal of Computational Biology, 7(3-4): 429-447.
5- Coman, D., Altenhoff, A., Zoller, S., Gruissem, W. and Vranová, E. 2014. Distinct evolutionary strategies in the GGPPS family from plants. Frontiers in plant science, 5.
6- Conant, G. C. and Wolfe, K. H. 2008. Turning a hobby into a job: how duplicated genes find new functions. Nature Reviews Genetics, 9(12): 938-950.
7- Demuth, J. P. and Hahn, M. W. 2009. The life and death of gene families. Bioessays, 31(1): 29-39.
8- Dudareva, N., Klempien, A., Muhlemann, J. K. and Kaplan, I. 2013. Biosynthesis, function and metabolic engineering of plant volatile organic compounds. New Phytologist, 198(1): 16-32.
9- Emanuelsson, O., Nielsen, H., Brunak, S. and Von Heijne, G. 2000. Predicting subcellular localization of proteins based on their N-terminal amino acid sequence. Journal of molecular biology, 300(4): 1005-1016.
10- Emanuelsson, O., Nielsen, H. and Von Heijne, G. 1999. ChloroP, a neural network-based method for predicting chloroplast transit peptides and their cleavage sites. Protein Science, 8(5): 978-984.
11- Gershenzon, J. and Dudareva, N. 2007. The function of terpene natural products in the natural world. Nature chemical biology, 3(7): 408-414.
12- Goodstein, D. M., Shu, S., Howson, R., Neupane, R., Hayes, R. D., Fazo, J., Mitros, T., Dirks, W., Hellsten, U. and Putnam, N. 2011. Phytozome: a comparative platform for green plant genomics. Nucleic acids research, 40(D1): D1178-D1186.
13- Guindon, S., Dufayard, J.-F., Lefort, V., Anisimova, M., Hordijk, W. and Gascuel, O. 2010. New algorithms and methods to estimate maximum-likelihood phylogenies: assessing the performance of PhyML 3.0. Systematic biology, 59(3): 307-321.
14- Hall, T. 2013. BioEdit version 7.2. 5. Ibis Biosciences, Carlsbad, CA, USA.
15- Hanada, K., Zou, C., Lehti-Shiu, M. D., Shinozaki, K. and Shiu, S.-H. 2008. Importance of lineage-specific expansion of plant tandem duplicates in the adaptive response to environmental stimuli. Plant physiology, 148(2): 993-1003.
16- Hedden, P. and Kamiya, Y. 1997. Gibberellin biosynthesis: enzymes, genes and their regulation. Annual review of plant biology, 48(1):431-460.
17- Hedges, S. B., Dudley, J. and Kumar, S. 2006. TimeTree: a public knowledge-base of divergence times among organisms. Bioinformatics, 22(23): 2971-2972.
18- Innan, H. and Kondrashov, F. 2010. The evolution of gene duplications: classifying and distinguishing between models. Nature Reviews Genetics, 11(2): 97-108.
19- Kappers, I. F., Aharoni, A., Van Herpen, T. W., Luckerhoff, L. L., Dicke, M. and Bouwmeester, H. J. 2005. Genetic engineering of terpenoid metabolism attracts bodyguards to Arabidopsis Science, 309(5743): 2070-2072.
20- Katoh, K. and Standley, D. M. 2013. MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Molecular biology and evolution, 30(4): 772-780.
21- Kuntz, M., Römer, S., Suire, C., Hugueney, P., Weil, J., Schantz, R. and Camara, B. 1992.  Identification of a cDNA for the plastid‐located geranylgeranyl pyrophosphate synthase from Capsicum annuum: correlative increase in enzyme activity and transcript level during fruit ripening. The Plant Journal, 2(1): 25-34.
22- Marques, A. C., Vinckenbosch, N., Brawand, D. and Kaessmann, H. 2008. Functional diversification of duplicate genes through subcellular adaptation of encoded proteins. Genome biology, 9(3): R54.
23- Moses, T., Pollier, J., Thevelein, J. M. and Goossens, A. 2013. Bioengineering of plant (tri) terpenoids: from metabolic engineering of plants to synthetic biology in vivo and in vitro. New Phytologist, 200(1): 27-43.
24- Nevoigt, E. 2008. Progress in metabolic engineering of Saccharomyces cerevisiae. Microbiology and Molecular Biology Reviews, 72(3): 379-412.
25- Nowicka, B. and Kruk, J. 2010. Occurrence, biosynthesis and function of isoprenoid quinones. Biochimica et Biophysica Acta (BBA)-Bioenergetics, 1797(9): 1587-1605.
26- Okada, K., Saito, T., Nakagawa, T., Kawamukai, M. and Kamiya, Y. 2000. Five geranylgeranyl diphosphate synthases expressed in different organs are localized into three subcellular compartments in Arabidopsis. Plant physiology, 122(4): 1045-1056.
27- Penn, O., Privman, E., Ashkenazy, H., Landan, G., Graur, D. and Pupko, T. 2010. GUIDANCE: a web server for assessing alignment confidence scores. Nucleic acids research, 38(suppl 2): W23-W28.
28- Petersen, T. N., Brunak, S., von Heijne, G. and Nielsen, H. 2011. SignalP 4.0: discriminating signal peptides from transmembrane regions. Nature methods, 8(10): 785-786.
29- Petsalaki, E. I., Bagos, P. G., Litou, Z. I. and Hamodrakas, S. J. 2006. PredSL: a tool for the N-terminal sequence-based prediction of protein subcellular localization. Genomics, proteomics & bioinformatics, 4(1): 48-55.
30- Proost, S., Van Bel, M., Vaneechoutte, D., Van de Peer, Y., Inzé, D., Mueller-Roeber, B. and Vandepoele, K.  2015. PLAZA 3.0: an access point for plant comparative genomics. Nucleic Acids Research, 43(D1): D974-D981.
31- Reams, A. B. and Neidle, E. L. 2004. Selection for gene clustering by tandem duplication. Annu. Rev. Microbiol., 58: 119-142.
32- Rogers, R. L., Cridland, J. M., Shao, L., Hu, T. T., Andolfatto, P. and Thornton, K. R. 2015. Tandem duplications and the limits of natural selection in Drosophila yakuba and Drosophila simulans', PloS one, 10(7): e0132184.
33- Sperschneider, J., Catanzariti, A.-M., DeBoer, K., Petre, B., Gardiner, D. M., Singh, K. B., Dodds, P. N. and Taylor, J. M. 2017.LOCALIZER: subcellular localization prediction of both plant and effector proteins in the plant cell. Scientific Reports, 7.
34- Takahashi, S., Ogiyama, Y., Kusano, H., Shimada, H., Kawamukai, M. and Kadowaki, K. 2006. Metabolic engineering of coenzyme Q by modification of isoprenoid side chain in plant. FEBS letters, 580(3): 955-959.
35- Voldoire, E., Brunet, F., Naville, M., Volff, J.-N. and Galiana, D. 2017. Expansion by whole genome duplication and evolution of the sox gene family in teleost fish. PloS one, 12(7), pp. e0180936.
36- Yang, Z. 2007. PAML 4: phylogenetic analysis by maximum likelihood. Molecular biology and evolution, 24(8), pp. 1586-1591.
37- Zhu, X., Suzuki, K., Saito, T., Okada, K., Tanaka, K., Nakagawa, T., Matsuda, H. and Kawamukai, M. 1997. Geranylgeranyl pyrophosphate synthase encoded by the newly isolated gene GGPS6 from Arabidopsis thaliana is localized in mitochondria. Plant molecular biology, 35(3): 331-341.