Evaluation of RNA Folding, evolutionary relationships, and Molecular modeling of Substrate-Enzyme Interactions in the Luciola sp. Luciferase by molecular docking and bioinformatic analysis

Document Type : Research Paper

Authors
1 Department of Biotechnology, Institute of Science and High Technology and Environmental Sciences, Graduate University of Advanced Technology, Kerman, I.R. of Iran;
2 Department of Molecular and Cell Biology, Faculty of Basic Sciences, Kosar University of Bojnord, Bojnord, Iran.
Abstract
Luciferases are enzymes that are involved in the emission of light are widely used in the field of industrial and medical biotechnology. We previously reported the cloning of the luciferase gene from the Iranian firefly, Luciola sp. Using computational methods, we analyzed the hidden layer of genetic and structural data in the Luciola sp. For this, with the help of ACUA software, the ENC and CBI were studied and the AT1, GC1, AT2, GC2, AT3, and GC3 contents were calculated. In the following, the UNAFold and Mfold Servers were used to predict RNA folding. The 3D model analysis and ChExVis method was used for extracting, storing, and analyzing luciferase channels. Finally, in silico substrate docking was conducted in the AutoDock Vina. The GC3 Skewness and GC3% of the cds were calculated as 0.39 and 17.153, respectively. This analysis shows that there are some rare codons of Pro, Arg, Ile, and Leu. The docking of 5'-O-[N-(Dehydroluciferyl)-sulfamoyl]-adenosine with luciferase was conducted and a network of interactions was identified. In the RNAfold applet, the best secondary structure has a free energy of -397.70 kcal/mol and the thermodynamic free energy is -427.28 kcal/mol. In the ensemble, the frequency of the MFE structure is 0.00 % and the diversity of the ensemble is 477.94. In this study, some hidden biological information from the genetic code was identified which may have a function in the proper folding and substrate-binding site and show that codon compositions may have roles in the proper folding of this enzyme.

Keywords

Subjects


ارزیابی فولدینگ RNA، روابط تکاملی، و مدل‌سازی مولکولی برهمکنش‌های سوبسترا-آنزیم در لوسیفراز Luciola sp. با داکینگ مولکولی و آنالیزهای بیوانفورماتیک

مجتبی مرتضوی1*، مسعود ترک زاده ماهانی1، مهدی رحیمی1 و علی ریاحی مدوار2

1 گروه بیوتکنولوژی، پژوهشکده علوم محیطی، پژوهشگاه علوم و تکنولوژی پیشرفته  و علوم محیطی، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان، ایران

2 گروه بیولوژی مولکولی و سلولی، دانشکده علوم پایه، دانشگاه کوثر بجنورد، بجنورد، ایران

تاریخ دریافت: 03/03/1401          تاریخ پذیرش: 12/10/1401

چکیده

آنزیم­­های لوسیفراز، آنزیم هایی هستند که در انتشار نور نقش دارند و به طور گسترده در زمینه بیوتکنولوژی صنعتی و پزشکی استفاده می شوند. ما قبلاً کلون سازی ژن لوسیفراز را از کرم شب تاب گونه ایرانی Luciola sp. گزارش کرده بودیم. با استفاده از روش‌های محاسباتی، لایه پنهان داده‌های ژنتیکی و ساختاری را در Luciola sp. تجزیه و تحلیل کردیم. برای این منظور با کمک نرم افزار ACUA، ENC  و CBI مورد مطالعه قرار گرفت و محتوای AT1، GC1، AT2، GC2، AT3  و GC3 محاسبه شد. در ادامه از سرورهای UNAFold و Mfold برای پیش‌بینی تاخوردگی RNA استفاده شد. از روش ChExVis برای استخراج، ذخیره و آنالیز کانال های لوسیفراز استفاده شد. در نهایت، داکینگ سوبسترا توسط نرم افزار AutoDock Vina انجام شد. این تجزیه و تحلیل نشان می دهد که کدون های نادر  Pro، Arg، Ile  و Leu درتوالی این ژن وجود دارد. داکینگ 5'-O-[N-(Dehydroluciferyl)-sulfamoyl]-adenosine  با لوسیفراز انجام شد و شبکه ای از میانکنش ها شناسایی شد. در پایگاه محاسباتی RNAfold، بهترین ساختار ثانویه دارای انرژی آزاد 70/397- کیلوکالری بر مول و انرژی آزاد ترمودینامیکی 28/427- کیلوکالری بر مول است. در این مطالعه، برخی اطلاعات بیولوژیکی پنهان از کد ژنتیکی شناسایی شد که ممکن است در فرایند فولدینگ و اتصال به سوبسترا نقش داشته باشند و نشان دهد که ترکیبات کدونی ممکن است در فولدینگ مناسب این آنزیم نقش داشته باشند.

واژه های کلیدی: لوسیفراز، داکینگ، کدون نادر، فولدینگ  RNA، AutoDock Vina.

*نویسنده مسئول، پست الکترونیکی: mortezavimm@gmail.com

مقدمه

 

واکنش نشر نور کرم شب تاب و سوسک های کلیک توسط آنزیم لوسیفراز کاتالیز می شود.  در ابتدا یک اسید انیدرید بین گروه لوسیفرین و -COO- از AMP در حالت برانگیخته الکترونیکی تشکیل می شود که با بازگشت به حالت پایه نور ساطع می شود (9). سنجش‌های مبتنی بر لوسیفراز غیر رادیواکتیو و حساس هستند و در زمینه‌های مختلف بیوتکنولوژی پزشکی مانند تشخیص زنده‌مانی میکروبی، تشخیص سرطان، تشخیص ATP ، سنتز پروتئین بدون سلول گزارشگر ژنتیکی و تعیین فعالیت فسفاتاز استفاده می‌شوند (10, 15, 25, 28, 30). در این راستا، تعدادی از لوسیفرازهای ایرانی نیز قبلا کلونینگ و توالی یابی شده اند (11, 19).

از چالش های مهم در بیان آنزیم لوسیفراز بهینه سازی کدونی و تغییر کدون‌هاست. جهش های مترادف  یکی از چالش های مهم در حوزه بیوتکنولوژی و بیوتکنولوژی پزشکی است. این جهش ها توالی کد کننده mRNA را تغییر می دهند، اما توالی اسیدهای آمینه را حفظ می کنند. بنابراین، از نظر تاریخی، این جهش ها از نظر فنوتیپی خاموش در نظر گرفته شده اند و اغلب در مطالعات مختلف ژنتیک انسانی نادیده گرفته می­شوند (21, 51). قبلاً تصور می­شد که جهش­های مترادف خاموش هستند و اهمیت کمی دارند، اما این موضوع توجه فزاینده ای از سوی فارماکولوژیست ها و ژنتیک دانان به سمت خود جلب کرده است (16, 42). مطالعات قبلی نشان می‌دهد که جهش‌های مترادف ممکن است بر مکان‌های اتصال miRNA، پایداری mRNA و تغییر ساختار و عملکرد پروتئین تأثیر بگذارد (36, 44). مطالعات دیگر جهش‌های مترادف نشان داده است که در پروتئین‌ها، این جهش‌ها عملکردی و از نظر ساختاری مهم هستند و تأثیرات قابل‌توجهی بر عملکرد و بیان پروتئین ایجاد می‌کنند (17, 40). علاوه براین، سایر مطالعات نشان داده اند که یکی از عوامل موثر بر ترکیب پروتئین نهایی و فرآیند تاخوردگی همزمان، تغییر در سرعت ترجمه است (22).

مطالعات نشان می دهد که جهش­های مترادف ویژگی سوبسترا و محل اتصال سوبسترا را در ژن P-گلیکوپروتئین تغییر می دهند (20). از سوی دیگر، فرض بر این است که در مرحله اولیه تکامل سلولی، یکی از ویژگی های ماشین ترجمه، خطای بالای آن بود که در ابتدا تنها چند اسید آمینه را کدگذاری می‌کرد و در ادامه، اسیدهای آمینه جدیدی در طول تکامل به این کدها اضافه شدند (39). این نتایج با این مفهوم سازگار است که در طول تکامل کدون های مترادف در بیان و عملکرد پروتئین ترجمه شده بسیار مؤثر بوده اند (45). تاکنون مطالعات ژنتیکی، بیوفیزیکی و بیوشیمیایی زیادی انجام شده است که از طریق آن ویژگی‌ها و اثرات دستگاه ترجمه مشخص می‌شود (37). اگر نتایج قابل مقایسه ای در دسترس باشد، باید در دیدگاه خود در مورد ضریب تاثیر جهش های مترادف  تجدید نظر کنیم (1). با این حال، جهش‌های مترادف  بر جنبه‌های مختلف پروتئین‌ها تأثیر می‌گذارند و هنوز سؤالات زیادی در مورد مکانیسم‌هایی که این اثرات را تنظیم می‌کنند وجود دارد.

اخیراً، ما کلونینگ ژن لوسیفراز کرم شب تاب ایرانی را از گونه Luciola sp. گزارش کرده‌ایم (19). با توجه به کاربرد گسترده این آنزیم در زمینه بیوتکنولوژی، مطالعه دقیق ویژگی های کدونی و ساختاری این آنزیم اهمیت زیادی دارد. این داده ها در فرایندهای بعدی مهندسی این آنزیم مانند انتخاب جهش جهت تغییر فعالیت، انتخاب میزبان بیانی و بیان آنزیم فعال بسیار اهمیت دارد. چراکه انتخاب نامناسب کدونها می تواند منجر به تولید آنزیم غیرفعال گردد. ما برای اولین بار ویژگی‌های فولدینگ RNA، اتصال سوبسترا، کانال‌ها و کدون‌ها را در این لوسیفراز ایرانی بررسی کردیم. همچنین، ویژگی­های ژنتیکی از جمله تعداد موثر کدون  (ENC)، ​​شاخص سوگیری کدون  (CBI) و شاخص تطبیق کدونی (CAI) ارزیابی شد. علاوه بر این، وضعیت کدون ها توسط سرور RaCC و سایر وب سرورهای محاسباتی مورد مطالعه قرار گرفت (7, 47). در این مطالعه، برخی از ویژگی های کدونها مشخص شد، و در ساختار سه بعدی لوسیفراز Luciola sp. مطالعه شدند. این کدون ها با استفاده از نرم افزار SPDBV (Swiss-PdbViewer)  (18) و PyMOL (8) مورد ارزیابی و تجزیه و تحلیل قرار گرفتند. ساختارهای ثانویه RNA توسط سرورهای UNAFold و Mfold پیش‌بینی شد(26, 54).

مطالعه رونویسی mRNA ممکن است مکانیسم فولدینگ ساختار لوسیفراز را روشن کند. روش ChExVis روشی کارآمد است که برای استخراج، ذخیره و آنالیز کانال های پروتئینی استفاده می شود (29) . در نهایت، شبیه سازی اتصال مولکولی مولکول سوبسترای (5'-O-[N-(Dehydroluciferyl)-sulfamoyl])  و آنزیم با استفاده از AutoDock Vina (31) انجام شد (49). این ارزیابی‌های داده‌های پنهان می‌تواند تکامل مولکولی آنزیم و بینش‌هایی درباره تاریخچه ژن را نشان دهد. تجزیه و تحلیل این داده ها می تواند روند شناسایی نقش استفاده از کدون در لوسیفراز کرم شب تاب را تسهیل کند. تعیین ویژگی های خاص این ژن لوسیفراز می تواند توسعه بیوتکنولوژی پزشکی این آنزیم حیاتی را تسهیل کند.

مواد و روشها

تجزیه و تحلیل توالی: قبلا، توالی DNA کد کننده لوسیفراز از گونه Luciola sp. شناسایی شده بود. کسر، فراوانی و تعداد کدون ها در توالی ژن مورد مطالعه قرار گرفت و کدون هایی که ترجیح داده شدند، در پایگاه محاسباتی Sequence Manipulation Suite شناسایی شدند (46) پایگاه محاسباتی Sequence Manipulation Suite مجموعه ای از برنامه های جاوا اسکریپت برای تولید، قالب بندی و آنالیز توالی های کوتاه DNA و پروتئین است. پایگاه محاسباتی Sequence Manipulation Suite یک توالی DNA را می پذیرد و یک نمودار گرافیکی متشکل از یک نوار افقی برای هر کدون ایجاد می کند. طول نوار متناسب با فرکانس کدون در جدول فرکانس کدونی است که وارد می کنید. از نمودار کدون برای یافتن بخش هایی از توالی DNA که ممکن است ضعیف بیان شوند استفاده می­شود. همچنین، پایگاه محاسباتی Sequence Manipulation Suite یک یا چند توالی DNA را می پذیرد و تعداد و فرکانس هر نوع کدون را برمی گرداند. از آنجایی که این برنامه همچنین فرکانس‌های کدون‌هایی را که برای همان اسید آمینه (کدون‌های مترادف) کد می‌کنند، مقایسه می‌کند، می‌توان از آن برای ارزیابی اینکه آیا یک دنباله برای کدون‌های مترادف خاصی ترجیح می‌دهد استفاده کرد. در ادامه از وب سرور RACC  برای آنالیز کدون های کمیاب استفاده شد. ترجیح استفاده از کدون ژن لوسیفراز در ابزار GCUA  مورد مطالعه قرار گرفت (13). تعداد کدون های ترجیحی توسط CBI نرمال شده بین 1- و 1 تعیین شد. با نرم افزار ACUA، تنوع سوگیری استفاده از کدون با استفاده از ENC و CBI تجزیه و تحلیل شد. محتویات  AT1، GC1، AT2، GC2،  AT3و GC3 نیز محاسبه شد (38). برای تجزیه و تحلیل درخت فیلوژنتیک، توالی های مرجع پروتئین گونه های مشابه از پایگاه داده NCBI به دست آمد و تراز چند توالی آنها (MSA) توسط برنامه ClustalW2 و MEGA 7 انجام شد. تجزیه و تحلیل شامل 16 توالی اسید آمینه بود.

مدل سازی ساختارهای ثانویه RNA: از سرورهای UNAFold و Mfold برای پیش‌بینی ساختارهای ثانویه RNA استفاده شد (27, 55). در این سرورها، پارامترهای ترمودینامیکی، از جمله حداقل انرژی آزاد (MFE)  و تابع پارتیشن به طور خودکار برای فولدینگ ساختار محاسبه می‌شوند. در این سرورها از پارامترهای پیش فرض استفاده شده است.

بررسی کانال های مولکولی: در ابتدا، ویژگی های کدون در PyMOL و SPDBV تجزیه و تحلیل شد. سپس آنالیزهای استریوشیمیایی این مدل در سرور نمودار راماچاندران انجام شد. در مطالعه توابع مولکولی، درک ساختار کانال هایی که به مکان های فعال منتهی می شوند مهم است. در این راستا از روش ChExVis  برای بررسی کانال ساختاری درون آنزیم استفاده شد. لوسیفراز حشرات شب تاب حاوی جایگاه فعال در دخل ساختار هستند و شناسایی و مشاهده کانال هایی که به محل فعال منتهی می شوند بسیار ارزشمند و مهم است.

داکینگ مولکولی: برای مطالعه داکینگ مولکولی، از AutoDock Vina (نسخه 1.1.2) استفاده شده است. 5'-O-[N-(Dehydroluciferyl)-sulfamoyl و لوسیفراز به ترتیب به عنوان لیگاند و گیرنده پروتئینی در نظر گرفته می شوند. مدل مولکولی سه بعدی این آنزیم در ابزار MGL (نسخه 1.5.4) به فرمت PDBQT تبدیل شد (31). فرمت SDF سوبسترا از پایگاه داده PubChem تهیه و فرمت آن از PDB در Open Babel (نسخه 2.3.1) به PDBQT تبدیل شد (38). این قالب PDB در ابزار MGL به قالب PDBQT تغییر یافت. مکان مشابهی از اتصال سوبسترا در آنزیم Luciola cruciata luciferase برای فضای جستجوی اتصال سوبسترا استفاده شد به گونه ای که تمام باقیمانده‌های اتصال سوبسترا درگیر شوند (35).

نتایج

استفاده از کدون و تجزیه و تحلیل ترکیب نوکلئوتیدی: ترکیب نوکلئوتیدی و رابطه بایاس کدون به ترتیب با در نظر گرفتن مقادیر C، C3، GC، GC3، A، A3، T، T3، G و G3 مورد مطالعه قرار گرفتند. مقادیر GC1، AT1، GC2، AT2، GC3 و AT3 برای مطالعه رابطه بین فشارهای ترکیبی و تنوع استفاده از کدون محاسبه شد. چولگی (دم تقارن توزیع احتمالی) و میزان  cds کدونهای GC3 به ترتیب 0.39 و 17.153 محاسبه شد (جدول 1). محتوای GC موقعیت کدون اول و دوم با محتوای GC در موقعیت کدون سوم مقایسه شد (جدول 1).

 

 

جدول 1- تجزیه و تحلیل بیوانفورماتیک توالی ژن لوسیفراز

A

536

A1

181

A2

186

A3

168

T

486

T1

170

T2

219

T3

97

G

345

G1

86

G2

62

G3

197

C

277

C1

111

C2

81

C3

85

AT%

62.165

AT1%

21.35

AT2%

24.635

AT3%

16.119

GC%

37.835

GC1%

11.983

GC2%

8.698

GC3%

17.153

AT Skewness

0.049

AT1 Skewness

0.031

AT2 Skewness

-0.081

AT3 Skewness

0.268

GC Skewness

0.109

GC1 Skewness

-0.127

GC2 Skewness

-0.133

GC3 Skewness

0.397

Total bp

1644

CAI

0.595

ENc

44.031

 

 

 

 

روابط تکاملی: شانزده توالی مشابه برای نمودار درخت فیلوژنتیک توسط سرور MEGA7 انتخاب شدند. توالی اسید آمینه این لوسیفرازها بازیابی و از NCBI به دست آمد. تاریخچه تکاملی با استفاده از روش Neighbor-Joining استنباط شد. درخت بهینه با مجموع طول شاخه = 1.34362215 نشان داده شده است (شکل 1). فواصل تکاملی با استفاده از روش تصحیح Poisson (53) محاسبه شد و بر حسب واحد تعداد جایگزینی اسید آمینه در هر سایت است. آنالیزهای تکاملی در MEGA7 انجام شد (23).

ارزیابی کدونهای نادر: کدون های مشکل ساز در سرور https://people.mbi.ucla.edu/sumchan/caltor آنالیز شدند.

 

 

 

شکل 1. تجزیه و تحلیل تکاملی و ساختاری آنزیم های لوسیفراز. (الف) درخت فیلوژنتیک خانواده لوسیفراز Lampyridae از Luciolinae، Lampyrinae و Photurinae. (ب) هم ترازی توالی پروتئین های آنزیم لوسیفراز از خانواده لامپرایدا. دامنه عناصر ساختاری ثانویه در بالا نشان داده شده است.

 

 

کدون‌های نادر آن دسته از کدون‌هایی هستند که با فرکانس‌های کمتر از 10% در ارگانیسم‌های بیانی خاص مانند اشریشیا کلی (E.coli) در مقایسه با میزبان اصلی استفاده می‌شوند. به این منظور توالی DNA هدف در قالب fasta تهیه می­شود. جدول کدونی از پایگاه داده http://www.kazusa.or.jp/codon استفاده می شود. با توجه به جدول کدونی، کدون های نادر با رنگ متفاوت در توالی DNA برجسته می شوند.این تجزیه و تحلیل نشان می دهد که هفت کدون نادر Pro 18، 183، 335، 368، 385، 396، 474، هفت کدون نادر  Arg 130، 219، 331، 338، 388، 387، 538 یک کدون نادر Ile 403، و چهار کدون نادر Leu 273، 310، 334، 527 وجود دارد. این تجزیه و تحلیل همچنین یک تکرار دوگانه پشت سر هم کدون نادر Arg را نشان میدهد (جدول 2).

Amino Acid

Rare Codon

Frequency of Occurrence

Arginine

CGA

3

CGG

0

AGG

0

AGA

4

Isoleucine

AUA

1

Leucine

CUA

4

Proline

CCC

7

 

جدول 2. فراوانی اسیدهای آمینه نادر  Leu، Arg، Ile، و Pro در توالی لوسیفراز Luciola sp.

   در حقیقت، موقعیت باقیمانده ها نقش مهمی در ساختار و فعالیت آنزیم ها دارد. فرکانس و تعداد کدون­ها در Sequence Manipulation Suite تعیین شدند. کسر، تعداد و فراوانی کدون­ها برای هر باقیمانده در جدول 3 ارائه شده است. نتایج نشان داد که کدون ها فرکانس های متفاوتی در این ژن دارند (جدول 3).

 

جدول 3. ویژگی های نوکلئوتیدی لوسیفراز Luciola sp.. تعداد، نسبت در 1000 و کسر فراوانی کدون­ها برای اسیدهای آمینه

 

 

AmAcid   Codon     Number        /1000     Fraction                      AmAcid   Codon     Number        /1000     Fraction

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

استخراج کانال مولکولی: ما قبلا ساختار این لوسیفراز را مدلسازی کردیم و در ادامه برای تحلیل ساختار جامع، از سرور راماچاندران برای تجزیه و تحلیل نمودار راماچاندران این مدل استفاده شد (2). در ادامه برای استخراج کانال مولکولی از روش ChExVis استفاده شد (29). در این روش، کانال ها به صورت هندسی محاسبه شدند و هم خط مرکزی و هم حجم اشغال شده توسط کانال گزارش شد. نتایج تحلیل کانال ها و وضعیت بستر در شکل 2 نشان داده شده است.

 

.

شکل 2. استخراج کانال در لوسیفراز. منافذ با رتبه برتر با استفاده از مدل توپ گرد (آبی) و موقعیت بستر در انتهای کانال نشان داده شده است. محل باقیمانده‌هایی که در کانال دخیل هستند: THR204، GLU412، LYS441، LYS445، LYS441، GLU412، GLU412، ILE413، LYS441، LYS208، THR204، THR204، LYLE335R44LY، GLU412، GLU441، GLY343، TYR342، TYR342، GLY318، GLY318، MET3

 

داکینگ مولکولی:  برای ارزیابی اتصال مولکولی، از AutoDock Vina  نسخه 1.1.2  (49) استفاده می شود. ساختار سه بعدی آنزیم در نرم افزار MGL به فرمت PDBQT تبدیل شد (31). فرمت SDF آدنوزین 5'-O-[N-(Dehydroluciferyl)-sulfamoyl]  از پایگاه داده PubChem گرفته شد و در Open Babel نسخه 2.3.1 به فرمت PDB تبدیل شد  (38). فضای جستجو در موقعیت مشابهی از Luciola cruciata luciferase (2d1tA) تعیین شد (35). در این فضا، بیشتر باقیمانده های متصل به سوبسترا انتخاب و ارزیابی شدند (شکل A3) .کمپلکس 5'-O-[N-(Dehydroluciferyl)-sulfamoyl]-adenosine-luciferase  با شبکه ای از برهمکنش ها در شکل B3 نشان داده شده است. همانطور که در شکل A3 نشان داده شده است، محل سوبسترا یک شکاف بزرگ در آنزیم است. نتایج، باقی مانده هایی را شناسایی کرد که با باقی مانده هایی که قبلاً در لوسیفرازهای دیگر شناسایی شده بودند، مشابه بودند.

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B

شکل 3. الف) تصویر فضایی از موقعیت اتصال 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] آدنوزین به luciola sp. توسط PyMol (رنگ آبی: ساختار لوسیفراز و رنگ قرمز: 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] adenosine ساخته شده است. ب) نمودار برهمکنش های آدنوزین 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] luciferase را نشان می دهد که توسط برنامه LIGPLOT ایجاد شده است.

 

 

برای تجزیه و تحلیل ساختاری، این کدون های نادر در مدل سه بعدی luciola sp. مورد مطالعه قرار گرفتند. لوسیفراز تجزیه و تحلیل مدل سه بعدی مکان های مختلف این کدون های کمیاب را نشان می دهد که پیوندهای غیرکووالانسی و هیدروژنی را با سایر اسیدهای آمینه تشکیل می دهند که توسط سرور PIC   وWHAT IF محاسبه می شود (48, 50). DSLA و برخی از کدون های کمیاب Arg در این ساختار لوسیفراز در شکل 4 نشان داده شده است.

مدل سازی فولدینگ RNA: با استفاده از اپلت RNAfold و وب سرور UNAFold، تاشوی RNA لوسیفراز مدل‌سازی شد و ویژگی‌های ترمودینامیکی و ساختار این لوسیفراز مورد تجزیه و تحلیل قرار گرفت (شکل 5).

در اپلت  RNAfold، بهترین ساختار دوم دارای انرژی آزاد 70/397- کیلوکالری بر مول (شکل 6) و انرژی آزاد ترمودینامیکی 28/427- کیلوکالری بر مول است. نمودار زیر مجموعه ترمودینامیکی ساختارهای  RNA، ساختار مرکز و ساختار MFE را نشان می دهد (شکل 6).

علاوه بر این، در وب سرور UNAFold، میزان ΔG  برابر با-428.30 kcal/Mol  می باشد. نمودار نقطه انرژی برای این سازه با بزرگنمایی 1 در شکل الف 7 نشان داده شده است. یک نمودار دایره ای یک ساختاری تولید می کند که در آن همپوشانی پایه ها معمولا کوچک است (شکل 7ب).

ارزیابی میزان تاخوردگی پروتئین: نادر بودن نسبی کدون ها برای ارزیابی سرعت فولدینگ پروتئین در الگوریتم%Min-Max ، تجزیه و تحلیل شد (6) (شکل 8). این  الگوریتم داده هایی را در مورد توزیع و فراوانی کدون های رایج و کمیاب ارائه می دهد. به طور تجربی، نشان داده شده است که کدون های کمیاب می توانند نرخ ترجمه محلی را کاهش دهند، اما همبستگی کامل نیست. بزرگترین اندازه در کدون 243 با %Min =50  قرار داشت.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

شکل 4. تصویر روبانی کدون های کمیاب Arg (سبز) و DSLA (قرمز) در مدل مولکولی لوسیفراز. همانطور که در شکل مشخص است کدونهای نادر در بخشهای مختلف ساختار لوسیفراز قرار گرفته اند و این کدونها در فرایند فولدینگ آنزیم لوسیفراز نقش مهمی ایفا می کنند.

 

 

 

 

 

 

 

 

 

 

شکل 5. ساختار دوم MFE و احتمال جفت مبتنی بر Centroid ژن لوسیفراز.

شکل 6. نمایش گراف ساختار MFE. نتایج با استفاده از RNAfold 2.4.18 محاسبه شده است.

 

 

 

 

 

 

 

 

 

 

 

الف

 

 

 

 

 

 

 

 

 

ب

شکل 7. الف: تا شدن RNA در وب سرور UNAFold نتیجه می دهد. کمان های G-C به رنگ قرمز کشیده شده اند. کمان های A-U، A-T به رنگ آبی کشیده شده اند. کمان های G-U، G-T به رنگ سبز کشیده شده اند. سایر کمان ها، در صورت وجود، به رنگ زرد هستند. ب: نمایش جفت پایه در نمودار دایره ای.

 

 

 

 

 

شکل 8. توزیع و فراوانی کدون های رایج و کمیاب در توالی نوکلئوتیدی لوسیفراز   Luciola sp

 

بحث

بیولومینسانس ظرفیت موجودات زنده برای انتشار نور مرئی است. با تولید فوتون در واکنش بیوشیمیایی، بیولومینسانس رخ می دهد که در زمینه های مختلف زیست شناسی به عنوان ابزاری در سنجش واکنش ها مانند سنجش ATP استفاده می شود. اگرچه در این سنجش ها، تابش نور مناسب بسیار مهم است، عوامل مختلفی مانند بیان کم، عدم فعالیت پروتئین و pH ممکن است بر تابش نور مناسب تأثیر بگذارد (14). علاوه بر این، موقعیت کانال، فولدینگ صحیح RNA، اتصال سوبسترا و کدون های کمیاب تاثیرات زیادی بر ساختار و فعالیت این آنزیم ها دارند (17). به منظور حل این مشکل، شبیه سازی و شناسایی لوسیفرازهای جدید بسیار حیاتی است. برای این منظور، کلونینگ و تعیین توالی لوسیفراز ایرانی گونه Luciola sp قبلا انجام شد. در ادامه این مطالعه، تجزیه و تحلیل چالش‌های مشکل‌ساز بیان این آنزیم همانند کدونهای نادر ، CAI، CBI، ENC، فولدینگ RNA، و داکینگ سوبسترا انجام شد. پیش از این مطالعات جامع متعددی در این زمینه بر روی لوسیفراز  و آنزیمهای دیگر انجام شده است (12, 32-34).

   برای تولید نور، برخی از باقیمانده‌ها نقش مهمی دارند و موقعیت ساختاری این بقایا در مدل Luciola sp. مورد بررسی قرار گرفت. علاوه بر این، وضعیت کدون‌های کمیاب مورد مطالعه قرار گرفت و برخی از کدون‌های کمیاب Arg در مدل سه‌بعدی ساختار لوسیفراز آنالیز شدند. مطالعات ما نشان داد که این Arg ها دارای برخی اینتراکشن های غیرکووالانسی هستند که در تشکیل بخش های مختلف ساختار آنزیم نقش دارند. سرعت فولدینگ آنزیم در این باقیمانده ها کاهش یافته است و برای مطالعه این ادعا به داده های تجربی نیاز است. در مرحله بعد، ارزیابی داکینگ مولکولی با استفاده از Vina AutoDock (31) انجام شد. تجزیه و تحلیل دقیق نشان می دهد که جایگاه فعال لوسیفراز کرم شب تاب ژاپنی (2d1t) مشابه مدل ما است (35) و از این رو، فضای جستجو با توجه به محل اتصال سوبسترا در لوسیفراز کرم شب تاب ژاپنی انجام می شود. نتایج در نرم افزار PyMOL و Ligplot مورد تجزیه و تحلیل قرار گرفت. مدل مناسب همراه با باقیمانده های درگیر در محل اتصال انتخاب شد. با این حال، اگرچه محل کلی بسترها شبیه به لوسیفراز ژاپنی Luciola cruciata بود، به دلیل حذف یون Mg2+ و چرخش ناحیه C ترمینال ، همه باقی مانده های قابل پیش بینی در نتایج داکینگ مشاهده نشدند.

   مطالعه قبلی نشان می دهد که کدون های کمیاب سرعت ترجمه را کاهش می دهند و ترشح پروتئین را در اشریشیا کلی تسهیل می کنند(24). در توالی‌های سیگنال پپتید در  Streptomyces coelicolor، برخی کدون‌های کمیاب برایArg ،  Ile  و Lys بیش از تکرار شده اند(24). در این راستا، نتایج مطالعه ما هفت باقیمانده با کدون نادر را شناسایی کرد که دور از مکان اتصال سوبسترا هستند. فعل و انفعالات غیرکووالانسی ایجاد شده توسط این Arg ممکن است تأثیر مهمی بر ساختار،  فولدینگ و تشکیل جایگاه فعال مناسب داشته باشد. در طراحی جهش­ها نیز باید به این یافته ها توجه کرد. علاوه بر این، در یک مطالعه قبلی، داکینگ بین آنزیم لوسیفراز Luciola Lateralis و لوسیفرین و سوبستراهای AMP مورد مطالعه قرار گرفت و نتایج نشان دهنده ساختار مشابه محل اتصال سوبسترا است (49). در مطالعه دیگری، الگوی اتصال مشابهی از DSLC و PTC124-AMP نشان داده شد (3). نتایج یک جایگاه اتصال سوبسترای مشابه را نشان می دهد و این مطالعات فرآیند داکینگ را تایید کرده و جایگاه فعالی که شناسایی شده است برای مطالعات بیشتر در مهندسی پروتئین قابل اعتماد است.

   ما از روش استخراج کانال مولکولی بر اساس نمایش کمپلکس آلفا استفاده کردیم. در این روش کانال های امکان پذیر به صورت هندسی محاسبه شدند. نتایج نشان می‌دهد که ChExVis کانال‌هایی را در این آنزیم شناسایی کرده است که مورد مطالعه قرار گرفته‌ و بینشی در مورد عملکرد مولکولی این آنزیم ایجاد خواهند کرد. برای مطالعه فولدینگ mRNA، فولدینگ RNA در فضای in silico از سرور RNAfold در پایگاه محاسباتی ViennaRNA انجام شد. ارزیابی الگوریتم %Min-Max نشان می‌دهد که این آنزیم باقیمانده‌های خود را با رایج‌ترین کدون‌ها رمزگذاری می‌کند. پارامترهای سوگیری استفاده از کدون به عنوان ترکیب پایه، CAI، CBI و ENC در این ژن مورد بررسی قرار گرفت. نتایج نشان می دهد که این ژن غنی از AT  به میزان 62 درصد است. از طرف دیگر، AT2% و GC3 دارای فرکانس بالاتر و AT3 و GC2 دارای فرکانس بسیار کمتری هستند. در بین ژن‌های مختلف، فشار جهش و انتخاب طبیعی دلایلی برای تنوع استفاده از کدون هستند (52). علاوه بر این، یک رابطه معکوس بین بیان ژن و ENC وجود دارد. مقدار ENC پایین تر بیان ژن و ترجیح استفاده از کدون را نشان می دهد (4).

   یک مطالعه نشان می‌دهد که تغییر سرعت ترجمه می‌تواند روی ترکیب پروتئین تأثیر بگذارد (20). تغییرات در الگوی استفاده از کدون می تواند تأثیرات چشمگیری بر روی مقدار پروتئین سنتز شده و بازده پروتئین به درستی تا شده داشته باشد. تغییرات در فرکانس استفاده از کدون در یک میزبان بیان هترولوگ می‌تواند منجر به تغییراتی در نرخ سنتز پروتئین محلی شود، زیرا کدون‌های مترادف نادر نسبت به همتایان معمول خود آهسته‌تر ترجمه می‌شوند. به طور کلی، کاهش سرعت ترجمه، زمان در دسترس بخش‌های N-ترمینال پروتئین را افزایش می‌دهد تا قبل از ظاهر شدن قسمت‌های C ترمینال، بخش‌های N-ترمینال به یک ساختار پایدار تا شوند (41).این داده‌ها نشان می‌دهند که ترکیبات کدون ممکن است در محل مناسب تاخوردگی و اتصال بستر نقش داشته باشند. همچنین باید توجه داشت که واگرایی بیشتری بین کدهای ژنتیکی میتوکندری و هسته ای وجود دارد که در سنتز پروتئین موثر است. از سوی دیگر، در ژن IBDV-vVP2، میزان سوگیری استفاده از کدون مترادف بر ساختار ثانویه پروتئین تأثیر می‌گذارد و نتایج، دیدگاه‌های مفیدی را برای درک تکامل و پاتوژنز ارائه می‌کنند(43). در این مطالعه، وضعیت استفاده از کدون، کدون‌های کمیاب و ارتباط بین محل‌های اتصال بستر و کدون‌های کمیاب مشخص شد. این داده ها یک نمای کلی از این آنزیم به عنوان تکامل و ساختار پروتئین ارائه می دهند. با این حال، برای ارزیابی مکانیسم‌های فعالیت آنزیم، یک رویکرد جهش‌زایی جهت‌دهی مکان است. در این مطالعه برخی از این باقیمانده های حیاتی شناسایی شدند. اما توضیح نتایج نیازمند مقایسه این ژن و مدل ساختاری با سایر ساختارها و ژن ها و تجزیه و تحلیل آزمایشگاهی است. این مطالعه به ما در طراحی و کاربردهای بیولوژیکی آینده سنجش مبتنی بر لوسیفراز کمک خواهد کرد.

نتیجه گیری نهایی

    مطالعه قبلی نشان می دهد که کدون های کمیاب سرعت ترجمه را کاهش می دهند و تغییر سرعت ترجمه می‌تواند روی ترکیب پروتئین تأثیر بگذارد. این تجزیه و تحلیل نشان می دهد که هفت کدون نادر Pro ، هفت کدون کمیاب  نادر Arg ، یک کدون نادر Ile  و چهار کدون نادر Leu  وجود دارد. به نظر می رسد توالی ناحیه 200 تا 250 در فرایند فولدینگ آنزیمنقش مهمی دارد. نتایج ما نشان داد که برخی از کدون‌های کمیاب Arg دارای اینتراکشن های غیرکووالانسی هستند و با تغییر سرعت فولدینگ آنزیم در تشکیل بخش های مختلف ساختار آنزیم نقش دارند. این داده‌ها نشان می‌دهند که ترکیبات کدونی در محل مناسب تاخوردگی و اتصال بستر نقش دارند.  نتایج داکینگ جایگاه اتصال سوبسترا را شناسایی کرده و جایگاه فعالی که شناسایی شده برای مطالعات بیشتر در مهندسی پروتئین قابل اعتماد است. در طراحی جهش­ها نیز باید به این یافته ها توجه کرد. این مطالعه در کاربردهای بیولوژیکی لوسیفراز بسیار مهم است.

قدردانی:

این پژوهش در قالب طرح پژوهشی شماره (1727/99/ص/7) با استفاده از اعتبار پژوهشی پژوهشگاه علوم و تکنولوژی پیشرفته  و علوم محیطی، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان ایران انجام شده است. 

1.   Agashe D, Martinez-Gomez NC, Drummond DA, et al. 2013. Good codons, bad transcript: large reductions in gene expression and fitness arising from synonymous mutations in a key enzyme.30(3):549-60.
2.   Anderson RJ, Weng Z, Campbell RK, et al. 2005. Mainchain conformational tendencies of amino acids.60(4):679-89.
3.   Auld DS, Lovell S, Thorne N, et al. 2010. Molecular basis for the high-affinity binding and stabilization of firefly luciferase by PTC124. Proc. Natl. Acad. Sci.107(11):4878-83.
4.   Bird CD, Emery NJ. 2009. Insightful problem solving and creative tool modification by captive nontool-using rooks. Proc. Natl. Acad. Sci. U. S. A.106(25):10370-5.
5.   Chappelle EW, Picciolo GL. 1975. Analytical applications of bioluminescence and chemiluminescence.
6.   Clarke IV TF, Clark PL. 2008. Rare codons cluster. PloS one.3(10).
7.   Daniel E, Onwukwe GU, Wierenga RK, et al. 2015. ATGme: Open-source web application for rare codon identification and custom DNA sequence optimization. BMC bioinformatics.16(1):303.
8.   DeLano WLJCNopc. 2002. Pymol: An open-source molecular graphics tool.40(1):82-92.
9.   DeLuca M, McElroy WD. 1974. Kinetics of the firefly luciferase catalyzed reactions. Biochemistry.13(5):921-5.
10. Eed HR, Abdel-Kader NS, El Tahan MH, et al. 2016. Bioluminescence-sensing assay for microbial growth recognition.2016.
11. Emamzadeh AR, Hosseinkhani S, Sadeghizadeh M, et al. 2006. cDNA cloning, expression and homology modeling of a luciferase from the firefly Lampyroidea maculata. BMB Reports.39(5):578-85.
12. Fattahi M, Malekpour A, Mortazavi M, et al. 2014. The characteristics of rare codon clusters in the genome and proteins of hepatitis C virus; a bioinformatics look.6(4):214.
13. Fuhrmann M, Hausherr A, Ferbitz L, et al. 2004. Monitoring dynamic expression of nuclear genes in Chlamydomonas reinhardtii by using a synthetic luciferase reporter gene. Plant molecular biology.55(6):869-81.
14. Gabriel GV, Viviani VR. 2014. Novel application of pH-sensitive firefly luciferases as dual reporter genes for simultaneous ratiometric analysis of intracellular pH and gene expression/location. Photochemical & Photobiological Sciences.13(12):1661-70.
15. Hosseinkhani SJP, Pharmacology. 2008. Expression and Purification of the luciferase enzyme and in Vivo ATP Assay.12(2):109-14.
16. Hunt RC, Simhadri VL, Iandoli M, et al. 2014. Exposing synonymous mutations.30(7):308-21.
17. Kane JF. 1995. Effects of rare codon clusters on high-level expression of heterologous proteins in Escherichia coli. Current opinion in biotechnology.6(5):494-500.
18. Kaplan W, Littlejohn TG. 2001. Swiss-PDB viewer (deep view). Brief. Bioinform.2(2):195-7.
19. Kargar F, Mortazavi M, Savardashtaki A, et al. 2019. Genomic and protein structure analysis of the luciferase from the Iranian bioluminescent beetle, Luciola sp. Int. J. Biol. Macromol.124:689-98.
20. Kimchi-Sarfaty C, Oh JM, Kim I-W, et al. 2007. A" silent" polymorphism in the MDR1 gene changes substrate specificity.315(5811):525-8.
21. Komar AAJHmg. 2016. The Yin and Yang of codon usage.25(R2):R77-R85.
22. Kudla G, Murray AW, Tollervey D, et al. 2009. Coding-sequence determinants of gene expression in Escherichia coli. science.324(5924):255-8.
23. Kumar S, Stecher G, Tamura KJMb, et al. 2016. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets.33(7):1870-4.
24. Li Y-D, Li Y-Q, Chen J-s, et al. 2006. Whole genome analysis of non-optimal codon usage in secretory signal sequences of Streptomyces coelicolor.85(3):225-30.
25. Lionetto MG, Caricato R, Calisi A, et al. 2016. Biomonitoring of water and soil quality: a case study of ecotoxicological methodology application to the assessment of reclaimed agroindustrial wastewaters used for irrigation.27(1):105-12.
26. Lorenz R, Bernhart SH, Zu Siederdissen CH, et al. 2011. ViennaRNA Package 2.0. Algorithms Mol. Biol.6(1):1-14.
27. Lorenz R, Bernhart SH, Zu Siederdissen CH, et al. 2011. ViennaRNA Package 2.0.6(1):1-14.
28. Lundin A. 2000. Use of firefly luciferase in ATP-related assays of biomass, enzymes, and metabolites. Methods in enzymology.305:346-70.
29. Masood TB, Sandhya S, Chandra N, et al. 2015. CHEXVIS: a tool for molecular channel extraction and visualization. BMC bioinformatics.16(1):1.
30. MiSKA W, GEIGER R. 1988. A new type of ultrasensitive bioluminogenic enzyme substrates. I. Enzyme substrates with D-luciferin as leaving group. Biological chemistry Hoppe-Seyler.369(1):407-12.
31. Morris GM, Huey R, Lindstrom W, et al. 2009. AutoDock4 and AutoDockTools4: Automated docking with selective receptor flexibility. J. Comput. Chem.30(16):2785-91.
32. Mortazavi M, Hosseinkhani SJPE, Design, Selection. 2011. Design of thermostable luciferases through arginine saturation in solvent-exposed loops.24(12):893-903.
33. Mortazavi M, Nezafat N, Negahdaripour M, et al. 2016. In silico evaluation of rare codons and their positions in the structure of cytosine deaminase and substrate docking studies.2(2).
34. Mortazavi M, Zarenezhad M, Gholamzadeh S, et al. 2016. Bioinformatic Identification of Rare Codon Clusters (RCCs) in HBV Genome and Evaluation of RCCs in Proteins Structure of Hepatitis B Virus. Hepat. Mon.16(10).
35. Nakatsu T, Ichiyama S, Hiratake J, et al. 2006. Structural basis for the spectral difference in luciferase bioluminescence. Nature.440(7082):372.
36. Niersch J, Vega-Rubín-de-Celis S, Bazarna A, et al. 2021. A BAP1 synonymous mutation results in exon skipping, loss of function and worse patient prognosis.24(3):102173.
37. Novoa EM, de Pouplana LRJTiG. 2012. Speeding with control: codon usage, tRNAs, and ribosomes.28(11):574-81.
38. O'Boyle NM, Banck M, James CA, et al. 2011. Open Babel: An open chemical toolbox. Journal of cheminformatics.3(1):33.
39. Pawlak K, Wnetrzak M, Mackiewicz D, et al. 2021. Models of genetic code structure evolution with variable number of coded labels.210:104528.
40. Plotkin JB, Kudla GJNRG. 2011. Synonymous but not the same: the causes and consequences of codon bias.12(1):32-42.
41. Sander IM, Chaney JL, Clark PLJJotACS. 2014. Expanding Anfinsen’s principle: contributions of synonymous codon selection to rational protein design.136(3):858-61.
42. Sauna ZE, Kimchi-Sarfaty CJNRG. 2011. Understanding the contribution of synonymous mutations to human disease.12(10):683-91.
43. Seligmann HJB. 2018. Alignment-based and alignment-free methods converge with experimental data on amino acids coded by stop codons at split between nuclear and mitochondrial genetic codes.167:33-46.
44. Sharma Y, Miladi M, Dukare S, et al. 2019. A pan-cancer analysis of synonymous mutations.10(1):1-14.
45. Spencer PS, Siller E, Anderson JF, et al. 2012. Silent substitutions predictably alter translation elongation rates and protein folding efficiencies.422(3):328-35.
46. Stothard P. 2000. The sequence manipulation suite: JavaScript programs for analyzing and formatting protein and DNA sequences. BioTechniques.28(6):1102-4.
47. Theodosiou A, Promponas VJ. 2012. LaTcOm: a web server for visualizing rare codon clusters in coding sequences. Bioinformatics.28(4):591-2.
48. Tina K, Bhadra R, Srinivasan N. 2007. PIC: protein interactions calculator. Nucleic acids research.35(suppl 2):W473-W6.
49. Trott O, Olson AJ. 2010. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading. J. Comput. Chem.31(2):455-61.
50. Vriend G. 1990. WHAT IF: a molecular modeling and drug design program. J. Mol. Graphics.8(1):52-6.
51. Walsh IM, Bowman MA, Santarriaga IFS, et al. 2020. Synonymous codon substitutions perturb cotranslational protein folding in vivo and impair cell fitness.117(7):3528-34.
52. Zhang Z, Dai W, Wang Y, et al. 2013. Analysis of synonymous codon usage patterns in torque teno sus virus 1 (TTSuV1). Arch. Virol.158(1):145-54.
53. Zuckerkandl E, Pauling L. Evolutionary divergence and convergence in proteins.  Evolving genes and proteins: Elsevier; 1965. p. 97-166.
54. Zuker M. 2003. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res.31(13):3406-15.
55. Zuker MJNar. 2003. Mfold web server for nucleic acid folding and hybridization prediction.31(13):3406-15.
Volume 37, Issue 4
Winter 2025
Pages 383-401

  • Receive Date 24 May 2022
  • Revise Date 27 July 2022
  • Accept Date 02 January 2023