Document Type : Research Paper
Keywords
Subjects
ارزیابی فولدینگ RNA، روابط تکاملی، و مدلسازی مولکولی برهمکنشهای سوبسترا-آنزیم در لوسیفراز Luciola sp. با داکینگ مولکولی و آنالیزهای بیوانفورماتیک
مجتبی مرتضوی1*، مسعود ترک زاده ماهانی1، مهدی رحیمی1 و علی ریاحی مدوار2
1 گروه بیوتکنولوژی، پژوهشکده علوم محیطی، پژوهشگاه علوم و تکنولوژی پیشرفته و علوم محیطی، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان، ایران
2 گروه بیولوژی مولکولی و سلولی، دانشکده علوم پایه، دانشگاه کوثر بجنورد، بجنورد، ایران
تاریخ دریافت: 03/03/1401 تاریخ پذیرش: 12/10/1401
چکیده
آنزیمهای لوسیفراز، آنزیم هایی هستند که در انتشار نور نقش دارند و به طور گسترده در زمینه بیوتکنولوژی صنعتی و پزشکی استفاده می شوند. ما قبلاً کلون سازی ژن لوسیفراز را از کرم شب تاب گونه ایرانی Luciola sp. گزارش کرده بودیم. با استفاده از روشهای محاسباتی، لایه پنهان دادههای ژنتیکی و ساختاری را در Luciola sp. تجزیه و تحلیل کردیم. برای این منظور با کمک نرم افزار ACUA، ENC و CBI مورد مطالعه قرار گرفت و محتوای AT1، GC1، AT2، GC2، AT3 و GC3 محاسبه شد. در ادامه از سرورهای UNAFold و Mfold برای پیشبینی تاخوردگی RNA استفاده شد. از روش ChExVis برای استخراج، ذخیره و آنالیز کانال های لوسیفراز استفاده شد. در نهایت، داکینگ سوبسترا توسط نرم افزار AutoDock Vina انجام شد. این تجزیه و تحلیل نشان می دهد که کدون های نادر Pro، Arg، Ile و Leu درتوالی این ژن وجود دارد. داکینگ 5'-O-[N-(Dehydroluciferyl)-sulfamoyl]-adenosine با لوسیفراز انجام شد و شبکه ای از میانکنش ها شناسایی شد. در پایگاه محاسباتی RNAfold، بهترین ساختار ثانویه دارای انرژی آزاد 70/397- کیلوکالری بر مول و انرژی آزاد ترمودینامیکی 28/427- کیلوکالری بر مول است. در این مطالعه، برخی اطلاعات بیولوژیکی پنهان از کد ژنتیکی شناسایی شد که ممکن است در فرایند فولدینگ و اتصال به سوبسترا نقش داشته باشند و نشان دهد که ترکیبات کدونی ممکن است در فولدینگ مناسب این آنزیم نقش داشته باشند.
واژه های کلیدی: لوسیفراز، داکینگ، کدون نادر، فولدینگ RNA، AutoDock Vina.
*نویسنده مسئول، پست الکترونیکی: mortezavimm@gmail.com
مقدمه
واکنش نشر نور کرم شب تاب و سوسک های کلیک توسط آنزیم لوسیفراز کاتالیز می شود. در ابتدا یک اسید انیدرید بین گروه لوسیفرین و -COO- از AMP در حالت برانگیخته الکترونیکی تشکیل می شود که با بازگشت به حالت پایه نور ساطع می شود (9). سنجشهای مبتنی بر لوسیفراز غیر رادیواکتیو و حساس هستند و در زمینههای مختلف بیوتکنولوژی پزشکی مانند تشخیص زندهمانی میکروبی، تشخیص سرطان، تشخیص ATP ، سنتز پروتئین بدون سلول گزارشگر ژنتیکی و تعیین فعالیت فسفاتاز استفاده میشوند (10, 15, 25, 28, 30). در این راستا، تعدادی از لوسیفرازهای ایرانی نیز قبلا کلونینگ و توالی یابی شده اند (11, 19).
از چالش های مهم در بیان آنزیم لوسیفراز بهینه سازی کدونی و تغییر کدونهاست. جهش های مترادف یکی از چالش های مهم در حوزه بیوتکنولوژی و بیوتکنولوژی پزشکی است. این جهش ها توالی کد کننده mRNA را تغییر می دهند، اما توالی اسیدهای آمینه را حفظ می کنند. بنابراین، از نظر تاریخی، این جهش ها از نظر فنوتیپی خاموش در نظر گرفته شده اند و اغلب در مطالعات مختلف ژنتیک انسانی نادیده گرفته میشوند (21, 51). قبلاً تصور میشد که جهشهای مترادف خاموش هستند و اهمیت کمی دارند، اما این موضوع توجه فزاینده ای از سوی فارماکولوژیست ها و ژنتیک دانان به سمت خود جلب کرده است (16, 42). مطالعات قبلی نشان میدهد که جهشهای مترادف ممکن است بر مکانهای اتصال miRNA، پایداری mRNA و تغییر ساختار و عملکرد پروتئین تأثیر بگذارد (36, 44). مطالعات دیگر جهشهای مترادف نشان داده است که در پروتئینها، این جهشها عملکردی و از نظر ساختاری مهم هستند و تأثیرات قابلتوجهی بر عملکرد و بیان پروتئین ایجاد میکنند (17, 40). علاوه براین، سایر مطالعات نشان داده اند که یکی از عوامل موثر بر ترکیب پروتئین نهایی و فرآیند تاخوردگی همزمان، تغییر در سرعت ترجمه است (22).
مطالعات نشان می دهد که جهشهای مترادف ویژگی سوبسترا و محل اتصال سوبسترا را در ژن P-گلیکوپروتئین تغییر می دهند (20). از سوی دیگر، فرض بر این است که در مرحله اولیه تکامل سلولی، یکی از ویژگی های ماشین ترجمه، خطای بالای آن بود که در ابتدا تنها چند اسید آمینه را کدگذاری میکرد و در ادامه، اسیدهای آمینه جدیدی در طول تکامل به این کدها اضافه شدند (39). این نتایج با این مفهوم سازگار است که در طول تکامل کدون های مترادف در بیان و عملکرد پروتئین ترجمه شده بسیار مؤثر بوده اند (45). تاکنون مطالعات ژنتیکی، بیوفیزیکی و بیوشیمیایی زیادی انجام شده است که از طریق آن ویژگیها و اثرات دستگاه ترجمه مشخص میشود (37). اگر نتایج قابل مقایسه ای در دسترس باشد، باید در دیدگاه خود در مورد ضریب تاثیر جهش های مترادف تجدید نظر کنیم (1). با این حال، جهشهای مترادف بر جنبههای مختلف پروتئینها تأثیر میگذارند و هنوز سؤالات زیادی در مورد مکانیسمهایی که این اثرات را تنظیم میکنند وجود دارد.
اخیراً، ما کلونینگ ژن لوسیفراز کرم شب تاب ایرانی را از گونه Luciola sp. گزارش کردهایم (19). با توجه به کاربرد گسترده این آنزیم در زمینه بیوتکنولوژی، مطالعه دقیق ویژگی های کدونی و ساختاری این آنزیم اهمیت زیادی دارد. این داده ها در فرایندهای بعدی مهندسی این آنزیم مانند انتخاب جهش جهت تغییر فعالیت، انتخاب میزبان بیانی و بیان آنزیم فعال بسیار اهمیت دارد. چراکه انتخاب نامناسب کدونها می تواند منجر به تولید آنزیم غیرفعال گردد. ما برای اولین بار ویژگیهای فولدینگ RNA، اتصال سوبسترا، کانالها و کدونها را در این لوسیفراز ایرانی بررسی کردیم. همچنین، ویژگیهای ژنتیکی از جمله تعداد موثر کدون (ENC)، شاخص سوگیری کدون (CBI) و شاخص تطبیق کدونی (CAI) ارزیابی شد. علاوه بر این، وضعیت کدون ها توسط سرور RaCC و سایر وب سرورهای محاسباتی مورد مطالعه قرار گرفت (7, 47). در این مطالعه، برخی از ویژگی های کدونها مشخص شد، و در ساختار سه بعدی لوسیفراز Luciola sp. مطالعه شدند. این کدون ها با استفاده از نرم افزار SPDBV (Swiss-PdbViewer) (18) و PyMOL (8) مورد ارزیابی و تجزیه و تحلیل قرار گرفتند. ساختارهای ثانویه RNA توسط سرورهای UNAFold و Mfold پیشبینی شد(26, 54).
مطالعه رونویسی mRNA ممکن است مکانیسم فولدینگ ساختار لوسیفراز را روشن کند. روش ChExVis روشی کارآمد است که برای استخراج، ذخیره و آنالیز کانال های پروتئینی استفاده می شود (29) . در نهایت، شبیه سازی اتصال مولکولی مولکول سوبسترای (5'-O-[N-(Dehydroluciferyl)-sulfamoyl]) و آنزیم با استفاده از AutoDock Vina (31) انجام شد (49). این ارزیابیهای دادههای پنهان میتواند تکامل مولکولی آنزیم و بینشهایی درباره تاریخچه ژن را نشان دهد. تجزیه و تحلیل این داده ها می تواند روند شناسایی نقش استفاده از کدون در لوسیفراز کرم شب تاب را تسهیل کند. تعیین ویژگی های خاص این ژن لوسیفراز می تواند توسعه بیوتکنولوژی پزشکی این آنزیم حیاتی را تسهیل کند.
مواد و روشها
تجزیه و تحلیل توالی: قبلا، توالی DNA کد کننده لوسیفراز از گونه Luciola sp. شناسایی شده بود. کسر، فراوانی و تعداد کدون ها در توالی ژن مورد مطالعه قرار گرفت و کدون هایی که ترجیح داده شدند، در پایگاه محاسباتی Sequence Manipulation Suite شناسایی شدند (46) پایگاه محاسباتی Sequence Manipulation Suite مجموعه ای از برنامه های جاوا اسکریپت برای تولید، قالب بندی و آنالیز توالی های کوتاه DNA و پروتئین است. پایگاه محاسباتی Sequence Manipulation Suite یک توالی DNA را می پذیرد و یک نمودار گرافیکی متشکل از یک نوار افقی برای هر کدون ایجاد می کند. طول نوار متناسب با فرکانس کدون در جدول فرکانس کدونی است که وارد می کنید. از نمودار کدون برای یافتن بخش هایی از توالی DNA که ممکن است ضعیف بیان شوند استفاده میشود. همچنین، پایگاه محاسباتی Sequence Manipulation Suite یک یا چند توالی DNA را می پذیرد و تعداد و فرکانس هر نوع کدون را برمی گرداند. از آنجایی که این برنامه همچنین فرکانسهای کدونهایی را که برای همان اسید آمینه (کدونهای مترادف) کد میکنند، مقایسه میکند، میتوان از آن برای ارزیابی اینکه آیا یک دنباله برای کدونهای مترادف خاصی ترجیح میدهد استفاده کرد. در ادامه از وب سرور RACC برای آنالیز کدون های کمیاب استفاده شد. ترجیح استفاده از کدون ژن لوسیفراز در ابزار GCUA مورد مطالعه قرار گرفت (13). تعداد کدون های ترجیحی توسط CBI نرمال شده بین 1- و 1 تعیین شد. با نرم افزار ACUA، تنوع سوگیری استفاده از کدون با استفاده از ENC و CBI تجزیه و تحلیل شد. محتویات AT1، GC1، AT2، GC2، AT3و GC3 نیز محاسبه شد (38). برای تجزیه و تحلیل درخت فیلوژنتیک، توالی های مرجع پروتئین گونه های مشابه از پایگاه داده NCBI به دست آمد و تراز چند توالی آنها (MSA) توسط برنامه ClustalW2 و MEGA 7 انجام شد. تجزیه و تحلیل شامل 16 توالی اسید آمینه بود.
مدل سازی ساختارهای ثانویه RNA: از سرورهای UNAFold و Mfold برای پیشبینی ساختارهای ثانویه RNA استفاده شد (27, 55). در این سرورها، پارامترهای ترمودینامیکی، از جمله حداقل انرژی آزاد (MFE) و تابع پارتیشن به طور خودکار برای فولدینگ ساختار محاسبه میشوند. در این سرورها از پارامترهای پیش فرض استفاده شده است.
بررسی کانال های مولکولی: در ابتدا، ویژگی های کدون در PyMOL و SPDBV تجزیه و تحلیل شد. سپس آنالیزهای استریوشیمیایی این مدل در سرور نمودار راماچاندران انجام شد. در مطالعه توابع مولکولی، درک ساختار کانال هایی که به مکان های فعال منتهی می شوند مهم است. در این راستا از روش ChExVis برای بررسی کانال ساختاری درون آنزیم استفاده شد. لوسیفراز حشرات شب تاب حاوی جایگاه فعال در دخل ساختار هستند و شناسایی و مشاهده کانال هایی که به محل فعال منتهی می شوند بسیار ارزشمند و مهم است.
داکینگ مولکولی: برای مطالعه داکینگ مولکولی، از AutoDock Vina (نسخه 1.1.2) استفاده شده است. 5'-O-[N-(Dehydroluciferyl)-sulfamoyl و لوسیفراز به ترتیب به عنوان لیگاند و گیرنده پروتئینی در نظر گرفته می شوند. مدل مولکولی سه بعدی این آنزیم در ابزار MGL (نسخه 1.5.4) به فرمت PDBQT تبدیل شد (31). فرمت SDF سوبسترا از پایگاه داده PubChem تهیه و فرمت آن از PDB در Open Babel (نسخه 2.3.1) به PDBQT تبدیل شد (38). این قالب PDB در ابزار MGL به قالب PDBQT تغییر یافت. مکان مشابهی از اتصال سوبسترا در آنزیم Luciola cruciata luciferase برای فضای جستجوی اتصال سوبسترا استفاده شد به گونه ای که تمام باقیماندههای اتصال سوبسترا درگیر شوند (35).
نتایج
استفاده از کدون و تجزیه و تحلیل ترکیب نوکلئوتیدی: ترکیب نوکلئوتیدی و رابطه بایاس کدون به ترتیب با در نظر گرفتن مقادیر C، C3، GC، GC3، A، A3، T، T3، G و G3 مورد مطالعه قرار گرفتند. مقادیر GC1، AT1، GC2، AT2، GC3 و AT3 برای مطالعه رابطه بین فشارهای ترکیبی و تنوع استفاده از کدون محاسبه شد. چولگی (دم تقارن توزیع احتمالی) و میزان cds کدونهای GC3 به ترتیب 0.39 و 17.153 محاسبه شد (جدول 1). محتوای GC موقعیت کدون اول و دوم با محتوای GC در موقعیت کدون سوم مقایسه شد (جدول 1).
جدول 1- تجزیه و تحلیل بیوانفورماتیک توالی ژن لوسیفراز
|
A |
536 |
A1 |
181 |
A2 |
186 |
A3 |
168 |
|
T |
486 |
T1 |
170 |
T2 |
219 |
T3 |
97 |
|
G |
345 |
G1 |
86 |
G2 |
62 |
G3 |
197 |
|
C |
277 |
C1 |
111 |
C2 |
81 |
C3 |
85 |
|
AT1% |
21.35 |
AT2% |
24.635 |
AT3% |
16.119 |
||
|
GC% |
37.835 |
GC1% |
11.983 |
GC2% |
8.698 |
GC3% |
17.153 |
|
AT Skewness |
0.049 |
AT1 Skewness |
0.031 |
AT2 Skewness |
-0.081 |
AT3 Skewness |
0.268 |
|
GC Skewness |
0.109 |
GC1 Skewness |
-0.127 |
GC2 Skewness |
-0.133 |
GC3 Skewness |
0.397 |
|
Total bp |
1644 |
CAI |
0.595 |
ENc |
44.031 |
|
|
روابط تکاملی: شانزده توالی مشابه برای نمودار درخت فیلوژنتیک توسط سرور MEGA7 انتخاب شدند. توالی اسید آمینه این لوسیفرازها بازیابی و از NCBI به دست آمد. تاریخچه تکاملی با استفاده از روش Neighbor-Joining استنباط شد. درخت بهینه با مجموع طول شاخه = 1.34362215 نشان داده شده است (شکل 1). فواصل تکاملی با استفاده از روش تصحیح Poisson (53) محاسبه شد و بر حسب واحد تعداد جایگزینی اسید آمینه در هر سایت است. آنالیزهای تکاملی در MEGA7 انجام شد (23).
ارزیابی کدونهای نادر: کدون های مشکل ساز در سرور https://people.mbi.ucla.edu/sumchan/caltor آنالیز شدند.
شکل 1. تجزیه و تحلیل تکاملی و ساختاری آنزیم های لوسیفراز. (الف) درخت فیلوژنتیک خانواده لوسیفراز Lampyridae از Luciolinae، Lampyrinae و Photurinae. (ب) هم ترازی توالی پروتئین های آنزیم لوسیفراز از خانواده لامپرایدا. دامنه عناصر ساختاری ثانویه در بالا نشان داده شده است.
کدونهای نادر آن دسته از کدونهایی هستند که با فرکانسهای کمتر از 10% در ارگانیسمهای بیانی خاص مانند اشریشیا کلی (E.coli) در مقایسه با میزبان اصلی استفاده میشوند. به این منظور توالی DNA هدف در قالب fasta تهیه میشود. جدول کدونی از پایگاه داده http://www.kazusa.or.jp/codon استفاده می شود. با توجه به جدول کدونی، کدون های نادر با رنگ متفاوت در توالی DNA برجسته می شوند.این تجزیه و تحلیل نشان می دهد که هفت کدون نادر Pro 18، 183، 335، 368، 385، 396، 474، هفت کدون نادر Arg 130، 219، 331، 338، 388، 387، 538 یک کدون نادر Ile 403، و چهار کدون نادر Leu 273، 310، 334، 527 وجود دارد. این تجزیه و تحلیل همچنین یک تکرار دوگانه پشت سر هم کدون نادر Arg را نشان میدهد (جدول 2).
|
Amino Acid |
Rare Codon |
Frequency of Occurrence |
|
Arginine |
CGA |
3 |
|
CGG |
0 |
|
|
AGG |
0 |
|
|
AGA |
4 |
|
|
Isoleucine |
AUA |
1 |
|
Leucine |
CUA |
4 |
|
Proline |
CCC |
7 |
جدول 2. فراوانی اسیدهای آمینه نادر Leu، Arg، Ile، و Pro در توالی لوسیفراز Luciola sp.
در حقیقت، موقعیت باقیمانده ها نقش مهمی در ساختار و فعالیت آنزیم ها دارد. فرکانس و تعداد کدونها در Sequence Manipulation Suite تعیین شدند. کسر، تعداد و فراوانی کدونها برای هر باقیمانده در جدول 3 ارائه شده است. نتایج نشان داد که کدون ها فرکانس های متفاوتی در این ژن دارند (جدول 3).
جدول 3. ویژگی های نوکلئوتیدی لوسیفراز Luciola sp.. تعداد، نسبت در 1000 و کسر فراوانی کدونها برای اسیدهای آمینه
AmAcid Codon Number /1000 Fraction AmAcid Codon Number /1000 Fraction
استخراج کانال مولکولی: ما قبلا ساختار این لوسیفراز را مدلسازی کردیم و در ادامه برای تحلیل ساختار جامع، از سرور راماچاندران برای تجزیه و تحلیل نمودار راماچاندران این مدل استفاده شد (2). در ادامه برای استخراج کانال مولکولی از روش ChExVis استفاده شد (29). در این روش، کانال ها به صورت هندسی محاسبه شدند و هم خط مرکزی و هم حجم اشغال شده توسط کانال گزارش شد. نتایج تحلیل کانال ها و وضعیت بستر در شکل 2 نشان داده شده است.
.
شکل 2. استخراج کانال در لوسیفراز. منافذ با رتبه برتر با استفاده از مدل توپ گرد (آبی) و موقعیت بستر در انتهای کانال نشان داده شده است. محل باقیماندههایی که در کانال دخیل هستند: THR204، GLU412، LYS441، LYS445، LYS441، GLU412، GLU412، ILE413، LYS441، LYS208، THR204، THR204، LYLE335R44LY، GLU412، GLU441، GLY343، TYR342، TYR342، GLY318، GLY318، MET3
داکینگ مولکولی: برای ارزیابی اتصال مولکولی، از AutoDock Vina نسخه 1.1.2 (49) استفاده می شود. ساختار سه بعدی آنزیم در نرم افزار MGL به فرمت PDBQT تبدیل شد (31). فرمت SDF آدنوزین 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] از پایگاه داده PubChem گرفته شد و در Open Babel نسخه 2.3.1 به فرمت PDB تبدیل شد (38). فضای جستجو در موقعیت مشابهی از Luciola cruciata luciferase (2d1tA) تعیین شد (35). در این فضا، بیشتر باقیمانده های متصل به سوبسترا انتخاب و ارزیابی شدند (شکل A3) .کمپلکس 5'-O-[N-(Dehydroluciferyl)-sulfamoyl]-adenosine-luciferase با شبکه ای از برهمکنش ها در شکل B3 نشان داده شده است. همانطور که در شکل A3 نشان داده شده است، محل سوبسترا یک شکاف بزرگ در آنزیم است. نتایج، باقی مانده هایی را شناسایی کرد که با باقی مانده هایی که قبلاً در لوسیفرازهای دیگر شناسایی شده بودند، مشابه بودند.
A
B
شکل 3. الف) تصویر فضایی از موقعیت اتصال 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] آدنوزین به luciola sp. توسط PyMol (رنگ آبی: ساختار لوسیفراز و رنگ قرمز: 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] adenosine ساخته شده است. ب) نمودار برهمکنش های آدنوزین 5'-O-[N-(Dehydroluciferyl)-sulfamoyl] luciferase را نشان می دهد که توسط برنامه LIGPLOT ایجاد شده است.
برای تجزیه و تحلیل ساختاری، این کدون های نادر در مدل سه بعدی luciola sp. مورد مطالعه قرار گرفتند. لوسیفراز تجزیه و تحلیل مدل سه بعدی مکان های مختلف این کدون های کمیاب را نشان می دهد که پیوندهای غیرکووالانسی و هیدروژنی را با سایر اسیدهای آمینه تشکیل می دهند که توسط سرور PIC وWHAT IF محاسبه می شود (48, 50). DSLA و برخی از کدون های کمیاب Arg در این ساختار لوسیفراز در شکل 4 نشان داده شده است.
مدل سازی فولدینگ RNA: با استفاده از اپلت RNAfold و وب سرور UNAFold، تاشوی RNA لوسیفراز مدلسازی شد و ویژگیهای ترمودینامیکی و ساختار این لوسیفراز مورد تجزیه و تحلیل قرار گرفت (شکل 5).
در اپلت RNAfold، بهترین ساختار دوم دارای انرژی آزاد 70/397- کیلوکالری بر مول (شکل 6) و انرژی آزاد ترمودینامیکی 28/427- کیلوکالری بر مول است. نمودار زیر مجموعه ترمودینامیکی ساختارهای RNA، ساختار مرکز و ساختار MFE را نشان می دهد (شکل 6).
علاوه بر این، در وب سرور UNAFold، میزان ΔG برابر با-428.30 kcal/Mol می باشد. نمودار نقطه انرژی برای این سازه با بزرگنمایی 1 در شکل الف 7 نشان داده شده است. یک نمودار دایره ای یک ساختاری تولید می کند که در آن همپوشانی پایه ها معمولا کوچک است (شکل 7ب).
ارزیابی میزان تاخوردگی پروتئین: نادر بودن نسبی کدون ها برای ارزیابی سرعت فولدینگ پروتئین در الگوریتم%Min-Max ، تجزیه و تحلیل شد (6) (شکل 8). این الگوریتم داده هایی را در مورد توزیع و فراوانی کدون های رایج و کمیاب ارائه می دهد. به طور تجربی، نشان داده شده است که کدون های کمیاب می توانند نرخ ترجمه محلی را کاهش دهند، اما همبستگی کامل نیست. بزرگترین اندازه در کدون 243 با %Min =50 قرار داشت.
شکل 4. تصویر روبانی کدون های کمیاب Arg (سبز) و DSLA (قرمز) در مدل مولکولی لوسیفراز. همانطور که در شکل مشخص است کدونهای نادر در بخشهای مختلف ساختار لوسیفراز قرار گرفته اند و این کدونها در فرایند فولدینگ آنزیم لوسیفراز نقش مهمی ایفا می کنند.
شکل 5. ساختار دوم MFE و احتمال جفت مبتنی بر Centroid ژن لوسیفراز.
شکل 6. نمایش گراف ساختار MFE. نتایج با استفاده از RNAfold 2.4.18 محاسبه شده است.
الف
ب
شکل 7. الف: تا شدن RNA در وب سرور UNAFold نتیجه می دهد. کمان های G-C به رنگ قرمز کشیده شده اند. کمان های A-U، A-T به رنگ آبی کشیده شده اند. کمان های G-U، G-T به رنگ سبز کشیده شده اند. سایر کمان ها، در صورت وجود، به رنگ زرد هستند. ب: نمایش جفت پایه در نمودار دایره ای.
شکل 8. توزیع و فراوانی کدون های رایج و کمیاب در توالی نوکلئوتیدی لوسیفراز Luciola sp
بحث
بیولومینسانس ظرفیت موجودات زنده برای انتشار نور مرئی است. با تولید فوتون در واکنش بیوشیمیایی، بیولومینسانس رخ می دهد که در زمینه های مختلف زیست شناسی به عنوان ابزاری در سنجش واکنش ها مانند سنجش ATP استفاده می شود. اگرچه در این سنجش ها، تابش نور مناسب بسیار مهم است، عوامل مختلفی مانند بیان کم، عدم فعالیت پروتئین و pH ممکن است بر تابش نور مناسب تأثیر بگذارد (14). علاوه بر این، موقعیت کانال، فولدینگ صحیح RNA، اتصال سوبسترا و کدون های کمیاب تاثیرات زیادی بر ساختار و فعالیت این آنزیم ها دارند (17). به منظور حل این مشکل، شبیه سازی و شناسایی لوسیفرازهای جدید بسیار حیاتی است. برای این منظور، کلونینگ و تعیین توالی لوسیفراز ایرانی گونه Luciola sp قبلا انجام شد. در ادامه این مطالعه، تجزیه و تحلیل چالشهای مشکلساز بیان این آنزیم همانند کدونهای نادر ، CAI، CBI، ENC، فولدینگ RNA، و داکینگ سوبسترا انجام شد. پیش از این مطالعات جامع متعددی در این زمینه بر روی لوسیفراز و آنزیمهای دیگر انجام شده است (12, 32-34).
برای تولید نور، برخی از باقیماندهها نقش مهمی دارند و موقعیت ساختاری این بقایا در مدل Luciola sp. مورد بررسی قرار گرفت. علاوه بر این، وضعیت کدونهای کمیاب مورد مطالعه قرار گرفت و برخی از کدونهای کمیاب Arg در مدل سهبعدی ساختار لوسیفراز آنالیز شدند. مطالعات ما نشان داد که این Arg ها دارای برخی اینتراکشن های غیرکووالانسی هستند که در تشکیل بخش های مختلف ساختار آنزیم نقش دارند. سرعت فولدینگ آنزیم در این باقیمانده ها کاهش یافته است و برای مطالعه این ادعا به داده های تجربی نیاز است. در مرحله بعد، ارزیابی داکینگ مولکولی با استفاده از Vina AutoDock (31) انجام شد. تجزیه و تحلیل دقیق نشان می دهد که جایگاه فعال لوسیفراز کرم شب تاب ژاپنی (2d1t) مشابه مدل ما است (35) و از این رو، فضای جستجو با توجه به محل اتصال سوبسترا در لوسیفراز کرم شب تاب ژاپنی انجام می شود. نتایج در نرم افزار PyMOL و Ligplot مورد تجزیه و تحلیل قرار گرفت. مدل مناسب همراه با باقیمانده های درگیر در محل اتصال انتخاب شد. با این حال، اگرچه محل کلی بسترها شبیه به لوسیفراز ژاپنی Luciola cruciata بود، به دلیل حذف یون Mg2+ و چرخش ناحیه C ترمینال ، همه باقی مانده های قابل پیش بینی در نتایج داکینگ مشاهده نشدند.
مطالعه قبلی نشان می دهد که کدون های کمیاب سرعت ترجمه را کاهش می دهند و ترشح پروتئین را در اشریشیا کلی تسهیل می کنند(24). در توالیهای سیگنال پپتید در Streptomyces coelicolor، برخی کدونهای کمیاب برایArg ، Ile و Lys بیش از تکرار شده اند(24). در این راستا، نتایج مطالعه ما هفت باقیمانده با کدون نادر را شناسایی کرد که دور از مکان اتصال سوبسترا هستند. فعل و انفعالات غیرکووالانسی ایجاد شده توسط این Arg ممکن است تأثیر مهمی بر ساختار، فولدینگ و تشکیل جایگاه فعال مناسب داشته باشد. در طراحی جهشها نیز باید به این یافته ها توجه کرد. علاوه بر این، در یک مطالعه قبلی، داکینگ بین آنزیم لوسیفراز Luciola Lateralis و لوسیفرین و سوبستراهای AMP مورد مطالعه قرار گرفت و نتایج نشان دهنده ساختار مشابه محل اتصال سوبسترا است (49). در مطالعه دیگری، الگوی اتصال مشابهی از DSLC و PTC124-AMP نشان داده شد (3). نتایج یک جایگاه اتصال سوبسترای مشابه را نشان می دهد و این مطالعات فرآیند داکینگ را تایید کرده و جایگاه فعالی که شناسایی شده است برای مطالعات بیشتر در مهندسی پروتئین قابل اعتماد است.
ما از روش استخراج کانال مولکولی بر اساس نمایش کمپلکس آلفا استفاده کردیم. در این روش کانال های امکان پذیر به صورت هندسی محاسبه شدند. نتایج نشان میدهد که ChExVis کانالهایی را در این آنزیم شناسایی کرده است که مورد مطالعه قرار گرفته و بینشی در مورد عملکرد مولکولی این آنزیم ایجاد خواهند کرد. برای مطالعه فولدینگ mRNA، فولدینگ RNA در فضای in silico از سرور RNAfold در پایگاه محاسباتی ViennaRNA انجام شد. ارزیابی الگوریتم %Min-Max نشان میدهد که این آنزیم باقیماندههای خود را با رایجترین کدونها رمزگذاری میکند. پارامترهای سوگیری استفاده از کدون به عنوان ترکیب پایه، CAI، CBI و ENC در این ژن مورد بررسی قرار گرفت. نتایج نشان می دهد که این ژن غنی از AT به میزان 62 درصد است. از طرف دیگر، AT2% و GC3 دارای فرکانس بالاتر و AT3 و GC2 دارای فرکانس بسیار کمتری هستند. در بین ژنهای مختلف، فشار جهش و انتخاب طبیعی دلایلی برای تنوع استفاده از کدون هستند (52). علاوه بر این، یک رابطه معکوس بین بیان ژن و ENC وجود دارد. مقدار ENC پایین تر بیان ژن و ترجیح استفاده از کدون را نشان می دهد (4).
یک مطالعه نشان میدهد که تغییر سرعت ترجمه میتواند روی ترکیب پروتئین تأثیر بگذارد (20). تغییرات در الگوی استفاده از کدون می تواند تأثیرات چشمگیری بر روی مقدار پروتئین سنتز شده و بازده پروتئین به درستی تا شده داشته باشد. تغییرات در فرکانس استفاده از کدون در یک میزبان بیان هترولوگ میتواند منجر به تغییراتی در نرخ سنتز پروتئین محلی شود، زیرا کدونهای مترادف نادر نسبت به همتایان معمول خود آهستهتر ترجمه میشوند. به طور کلی، کاهش سرعت ترجمه، زمان در دسترس بخشهای N-ترمینال پروتئین را افزایش میدهد تا قبل از ظاهر شدن قسمتهای C ترمینال، بخشهای N-ترمینال به یک ساختار پایدار تا شوند (41).این دادهها نشان میدهند که ترکیبات کدون ممکن است در محل مناسب تاخوردگی و اتصال بستر نقش داشته باشند. همچنین باید توجه داشت که واگرایی بیشتری بین کدهای ژنتیکی میتوکندری و هسته ای وجود دارد که در سنتز پروتئین موثر است. از سوی دیگر، در ژن IBDV-vVP2، میزان سوگیری استفاده از کدون مترادف بر ساختار ثانویه پروتئین تأثیر میگذارد و نتایج، دیدگاههای مفیدی را برای درک تکامل و پاتوژنز ارائه میکنند(43). در این مطالعه، وضعیت استفاده از کدون، کدونهای کمیاب و ارتباط بین محلهای اتصال بستر و کدونهای کمیاب مشخص شد. این داده ها یک نمای کلی از این آنزیم به عنوان تکامل و ساختار پروتئین ارائه می دهند. با این حال، برای ارزیابی مکانیسمهای فعالیت آنزیم، یک رویکرد جهشزایی جهتدهی مکان است. در این مطالعه برخی از این باقیمانده های حیاتی شناسایی شدند. اما توضیح نتایج نیازمند مقایسه این ژن و مدل ساختاری با سایر ساختارها و ژن ها و تجزیه و تحلیل آزمایشگاهی است. این مطالعه به ما در طراحی و کاربردهای بیولوژیکی آینده سنجش مبتنی بر لوسیفراز کمک خواهد کرد.
نتیجه گیری نهایی
مطالعه قبلی نشان می دهد که کدون های کمیاب سرعت ترجمه را کاهش می دهند و تغییر سرعت ترجمه میتواند روی ترکیب پروتئین تأثیر بگذارد. این تجزیه و تحلیل نشان می دهد که هفت کدون نادر Pro ، هفت کدون کمیاب نادر Arg ، یک کدون نادر Ile و چهار کدون نادر Leu وجود دارد. به نظر می رسد توالی ناحیه 200 تا 250 در فرایند فولدینگ آنزیمنقش مهمی دارد. نتایج ما نشان داد که برخی از کدونهای کمیاب Arg دارای اینتراکشن های غیرکووالانسی هستند و با تغییر سرعت فولدینگ آنزیم در تشکیل بخش های مختلف ساختار آنزیم نقش دارند. این دادهها نشان میدهند که ترکیبات کدونی در محل مناسب تاخوردگی و اتصال بستر نقش دارند. نتایج داکینگ جایگاه اتصال سوبسترا را شناسایی کرده و جایگاه فعالی که شناسایی شده برای مطالعات بیشتر در مهندسی پروتئین قابل اعتماد است. در طراحی جهشها نیز باید به این یافته ها توجه کرد. این مطالعه در کاربردهای بیولوژیکی لوسیفراز بسیار مهم است.
قدردانی:
این پژوهش در قالب طرح پژوهشی شماره (1727/99/ص/7) با استفاده از اعتبار پژوهشی پژوهشگاه علوم و تکنولوژی پیشرفته و علوم محیطی، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان ایران انجام شده است.
| Article View | 1,248 |
| PDF Download | 507 |