نوع مقاله : مقاله پژوهشی
کلیدواژهها
موضوعات
عنوان مقاله English
نویسندگان English
Introduction: Triple Negative breast cancer is a common cancer in the world that grows in breast tissue. The disease has became the biggest human health problem worldwide. Therefore, identifying the key genes involved in this disease can be useful in the diagnosis, prognosis and treatment. The aim of this study was to identify genes with significant expression differences affecting triple negative breast cancer using RNA sequencing transcriptomic data analysis of breast cancer patients compared to healthy individuals.
Methods: Illumina-sequenced transcriptomic data of three breast cancer patients and four healthy individuals were collected from the NCBI and SRA databases, and after controlling the quality of the readings using FastQC software, the sequences were aligned with Reference genome was performed with STAR software. Finally, featureCounts and DESeq2 softwares were used to investigate the differential expression of genes. Volcano graph was used to show genes with significant expression differences.
Results: In this study, 31 genes with differential expression were identified with a significance level of p
کلیدواژهها English
شناسایی ژنهای کلیدی دخیل در سرطان پستان سه گانه – منفی به عنوان نشانگر زیستی مستعد با استفاده از آنالیز دادههای ترانسکریپتومی توالی یابیRNA مبتلایان به سرطان پستان در مقایسه با افراد سالم
پگاه محبوب نیا1، مصطفی رفیعی پور1، رضا مهدیان2 و فریناز بهفرجام1*
1 ایران، قزوین، دانشگاه دانش البرز، دانشکده علوم، گروه ژنتیک
2 ایران، تهران، انستیتو پاستور ایران، گروه پزشکی مولکولی
تاریخ دریافت: 24/03/1401 تاریخ پذیرش: 16/09/1401
چکیده
سرطان پستان از نوع سه گانه – منفی نوعی سرطان شایع در جهان است که در بافت پستان رشد میکند. این بیماری تبدیل به بزرگترین مشکل سلامتی انسان در سراسر جهان شده است. بنابراین شناسایی ژنهای کلیدی درگیر در این بیماری میتواند در تشخیص، پیشآگهی و درمان مفید باشد. هدف تحقیق حاضر شناسایی ژنهای با اختلاف بیان معنادار موثر بر سرطان پستان سه گانه – منفی است که با استفاده از آنالیز دادههای ترانسکریپتومی توالی یابیRNA مبتلایان به سرطان پستان در مقایسه با افراد سالم انجام گرفت. دادههای ترانسکریپتوم تعیین توالی شده با دستگاه Illumina مربوط به سه فرد مبتلا به سرطان پستان از نوع سه گانه- منفی و چهار فرد سالم از پایگاه داده NCBI و SRA جمعآوری شده و پس از کنترل کیفیت خوانشها با استفاده از نرمافزار FastQC، همترازی توالیها با ژنوم مرجع با نرمافزار STAR انجام شد. در نهایت، جهت بررسی بیان افتراقی ژنها، از نرمافزارهای featureCounts و DESeq2 استفاده شد و ژنهای با اختلاف بیان معنادار به کمک نمودار Volcano نمایه گردید. در نهایت برای بررسی نقش ژنها در مسیرهای مولکولی، تجزیه و تحلیل هستی شناسی ژن انجام گرفت. در این تحقیق، 31 ژن دارای بیان افتراقی با سطح معنی داری p<0.05 شناسایی شد. در بین این 31 ژن، 11 ژن کاهش بیان و 20 ژن افزایش بیان نشان دادند. از جمله ژنهای شاخص این مجموعه ژنی، میتوان به ژنهای RNF223، ETV3L، CACNA1S، UPS34، NEURL3، CRYBG3 و FABP4 اشاره نمود. بررسی و مطالعات انجام شده در مورد این ژنها حاکی از نقش مهم آنها در مسیرها و فرآیندهای مولکولی درگیر در بیماریزایی افراد مبتلا به سرطان پستان از نوع سه گانه- منفی بود. بنابراین معرفی این نشانگرهای زیستی مهم در مکانیسمهای مولکولی حیاتی سلولها میتواند برای اهداف تشخیصی، درمانی و پیشگیری بسیار با اهمیت و منحصر بفرد باشد.
واژه های کلیدی: سرطان پستان، بیان افتراقی ژن، ترانسکریپتوم و پایگاه داده NCBI
*نویسنده مسئول، پست الکترونیکی:Behfarjam.farinaz@gmail.com
مقدمه
سرطان پستان یکی از هتروژنترین انواع سرطانها و علت 9/22% از سرطانها در زنان و دومین سرطان شایع در کشورهای درحال توسعه است [22]. برطبق جدیدترین آماری که ارائه شده است، سالانه 21/33 زن از هر 100000 زن در ایران با میانگین سنی 84/49 سال به سرطان پستان مبتلا میشوند که در این میان 2/14 نفر از هر 100000 نفر فوت میکنند [22]. تخمین زده میشود در سال 2030 در مجموع 4/26 میلیون مورد ابتلا به سرطان پستان در جهان وجود داشته باشد که 17 میلیون آن منجر به مرگ شود. در بین انواع مختلف سرطان پستان، نوع سه گانه – منفی (Triple Negative) دارای شیوع بالایی میباشد که این نوع، به گونهای از بیماری سرطان پستان گفته میشود که فاقد گیرنده استروژن (ER)، گیرنده پروژسترون (PR) وHER2/neu باشد [15].
از آنجایی که بافت پستان اندامی حساس به استروژن است و در ایران مصرف داروهای ضدبارداری و سایر موارد دارویی شامل استروژن و یا پیش ساز آن در کنار عواملی همچون رژیم پرچرب و کم فیبر شانس ابتلا به سرطان پستان را افزایش میدهد، تشخیص و درمان کارآمد دو مرحلهی حیاتی بشمار میآیند [11].
نشانگرهای بافتی از اولین نشانگرهای زیستی مرتبط با سرطان پستان میباشند، گیرندههای هورمونی مانند گیرنده استروژن و گیرنده پروژسترون از جمله اولین نشانگرهایی هستند که در مراحل ابتدایی انواع سرطان پستان جهت پیشآگهی و انتخاب روش درمانی مناسب بکار میروند [21]. گیرنده فاکتور رشد اپیدرمال انسانی نوع 2 (HER2) نیز دیگر نشانگر پیشآگهی سرطان پستان میباشد که پاسخ آن تنها در صورتی قابل اتکا است که گرههای لنفاوی نیز درگیر سرطان شده باشند. نشانگر زیستی یوروکیناز پلاسمینوژن و کاتپسین دی نیز در جهت پیشآگهی سرطانهای پستان با عدم درگیری گرههای لنفاوی کاربرد دارد [19] . در نهایت، میتوان از افزایش بیان P53 نیز به عنوان یک نشانگر زیستی برای پیشآگهی سرطان پستان نام برد اما به دلیل عدم اختصاصیت این نشانگر و مشاهدهی افزایش بیان P53 در بسیاری از انواع سرطانها به نظر میرسد نمیتواند نشانگر زیستی مفیدی واقع شود [14].
تاکنون حداقل هشت مجموعهی ژنی به عنوان نشانگرهای پیش آگهی پاتوژنز و درمان بیماری شناسایی شده است. در این میان، تغییرات بیانی 512 ژن دخیل در پاسخ به آسیب سلولی، تغییرات بیانی 97 ژن پیشبینی کننده درجه بیماری و تغییرات بیانی 32 ژن بیانگر درگیری پاسخ به آسیب بواسطه P53 و تغییرات بیانی 186 ژن، پیشبینی کننده تهاجمی/غیرتهاجمی بودن سرطان پستان میباشند [6]. بر اساس مواردی که ذکر شد و روشهای مختلفی که در راستای دستیابی به راهکارهای سریعتر در تشخیص، درمان و پیش آگهی بیماریهای مختلف علی الخصوص سرطان پستان نوع سه گانه – منفی وجود دارد، امروزه تمرکز بسیاری از محققان بر روی روشهای نوین توالی یابی نسل بعدی است که در این بین روش توالییابی RNA (RNA sequencing) دارای اهمیت شایان ذکری میباشد.
روش توالییابی RNA ، با استفاده از فناوری توالییابی نسل جدید، کمیت محتوای RNA یک نمونه زیستی را در یک بازه زمانی مشخص بررسی میکند. بنابراین به نظر میرسد با استفاده از این روش بتوان نشانگرهای دقیقتری را جهت پیشآگهی بیماریها عرضه کرد. پیشرفتهای اخیر در توالییابی نسل بعد باعث شده که بازه پوشش توالییابی توکلئوتیدهایDNA و همچنین مقدار نمونه ورودی برای توالییابی افزایش پیدا کند [11]. این پیشرفتها توالییابی رونوشتهای RNA سلول را تسهیل میکند و این امکان را فراهم میکند که رونوشتهای برش خورده ژن، تغییرات پس از رونویسی، همجوشی ژنها، جهشها و پلیمورفیسم تک نوکلئوتیدی و در نهایت تغییرات در بیان ژن را بررسی نماید [5]. توالییابی RNA فن آوری است که با بهرهگیری از تواناییهای «توالییابی نسل بعدی» برای بدست آوردن تصویری کلی از حضور و مقدار RNA از ژنوم در یک بازهی زمانی خاص استفاده میکند [5]. همچنین این روش دارای کاربردهایی همانند شناسایی تفاوتهای ژنتیکی، مسیرها و شبکههای زیست مولکولی موثر در بیماریزایی افراد است [10]. از اینرو، با توجه به عدم وجود راهکارهایی جهت تشخیص زود هنگام، اقدامات پیشگیرانه و روشهای درمانی مناسب بیماری سرطان پستان از نوع سه- گانه منفی و از طرفی به دلیل پیشرفتهای حاصله در زمینه روشهای نوین نسل بعدی توالی یابی، در این مطالعه دادههای مربوط به مطالعات ترانسکریپتوم بیماران مبتلا به سرطان پستان از نوع سه گانه منفی در مقایسه با افراد سالم با هدف شناسایی نشانگرهای زیستی احتمالی مورد مطالعه قرار گرفتند.
مواد و روشها
دریافت دادهها از پایگاه داده NCBI : از آنجایی که پایگاه دادهی NCBI یک سیستم یکپارچه بازیابی اطلاعات بوده و قادر به جستجوی همزمان در بانکهای مختلفی نظیر GeneBank، PubMed و سایر پایگاههای دادهی مشابه میباشد، دادههای مورد نیاز جهت انجام این تحقیق نیز از پایگاه دادهای NCBIو SRA بدست آمد [5]. در تحقیق حاضر از دادههای ترانسکریپتوم تعیین توالی شده با دستگاه Illumina مربوط به سه فرد مبتلا به سرطان پستان از نوع سه گانه- منفی و چهار فرد سالم از پایگاه داده NCBI و SRA استفاده شد (لینک دسترسی به دادهها: https://trace.ncbi.nlm.nih.gov/Traces/study/?acc=SRP235648&o=acc_s%3Aa). جدول 1 به اطلاعات دموگرافیک این دادهها اشاره میکند.
جدول 1- اطلاعات دموگرافیک دادههای ترانسکریپتومی بدست آمده از پایگاه داده NCBI و SRA
|
نام نمونه |
بیمار/سالم |
جنسیت |
سن |
منبع داده |
Layout* |
|
shC-1 |
سالم |
زن |
51 |
ترانسکریپتومی |
Paired |
|
shC-2 |
سالم |
زن |
51 |
ترانسکریپتومی |
Paired |
|
shC-3 |
سالم |
زن |
51 |
ترانسکریپتومی |
Paired |
|
shC-4 |
سالم |
زن |
51 |
ترانسکریپتومی |
Paired |
|
shMETTL18-1 |
بیمار |
زن |
51 |
ترانسکریپتومی |
Paired |
|
shMETTL18-2 |
بیمار |
زن |
51 |
ترانسکریپتومی |
Paired |
|
shMETTL18-3 |
بیمار |
زن |
51 |
ترانسکریپتومی |
Paired |
* خوانشهای دو طرفه
کنترل کیفیت خوانشها: پس از گرفتن دادهها از پایگاه داده NCBI و SRA، کنترل کیفیت آنها، به کمک نرمافزار Fast QC در محیط لینوکس انجام شد (https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) .نرمافزار Fast QC علاوه بر فهرست تعداد خوانشها و رمزگذاری کیفیت آنها، اطلاعات مربوط به کیفیت و محتوای بازها، طول خوانش و محتوای K-مر و همچنین حضور بازهای مبهم و مضاعف شدگیها را گزارش داده و مصورسازی میکند.
همردیفی خوانشها با ژنوم مرجع: در مرحلهی همردیف کردن خوانشها با ژنوم مرجع، دادههای تعیین کیفیت شده با ژنوم مرجع (GRCh38.p13 (GCA_000001405.28) http://ftp.ensembl.org/pub/release-106/fasta/homo_sapiens /dna/) همردیف شدند. در تحقیق حاضر جهت همردیفی توالیها از نرمافزار STAR استفاده شد (https://github.com/alexdobin/STAR/archive ) STAR یک برنامهی همردیفساز حساس و سریع است که برای همردیفی خوانشهای توالییابی NGS در ژنومهای انسانی مورد استفاده قرار میگیرد.
تبدیل فایلهای SAM به BAM : فایلهای SAM که معمولاً توسط همردیفسازها ایجاد میشوند نیازمند پردازشهایی نظیر تبدیل SAM/BAM، مرتبسازی، نمایهسازی یا ادغام هستند. در تحقیق حاضر از نرمافزار SAMtools و Picard استفاده شد. (https://sourceforge.net/ projects/samtools/) ابتدا فایلهای SAM به فایلهای BAM تبدیل شد. این کار با استفاده از مجموعهی Samtools از ابزارهای commandline صورت گرفت. از گزینهی n- مرتبسازی Samtools استفاده شد تا از این طریق اطمینان حاصل شود که فایل SAM بر اساس مشخصهی خوانش مرتب گردد.
مرتبسازی و نمایهسازی کردن فایلهای BAM : جهت انجام این دو مرحله از نرم افزار Samtools در محیط لینوکس استفاده شد. هدف از مرتبسازی دسترسی کارآمدتر به دادهها در این فایلها میباشد. فایل BAM مرتب شده دارای دادههایی است که بر اساس کروموزومها/ کانتیگها و داربستها در ژنوم مرجع مرتب شده است.
بررسی و شمارش خوانشهای همردیف با ژنها: جهت بررسی و شمارش خوانشهای همردیف شده به ژنها از نرمافزار FeatureCounts استفاده شد. (https://sourceforge.net/projects/subread/files/subread-2.0.3/) داده ورودی به نرمافزار FeatureCounts شامل یک یا چند فایل از خوانشهای همردیف شده با فرمت SAM یا BAM است. با استفاده از این نرم افزار تعداد خوانشهایی که با هر ژن همردیف شدهاند، مشخص میشود و از اینرو ویژگی خوانشها تعیین خواهد شد.
بررسی بیان افتراقی ژنها: آنالیز بیان افتراقی شامل شناسایی ژنها یا سایر انواع ترکیبات ژنومی مانند رونوشتها یا اگزونها است. در تحقیق حاضر جهت بررسی بیان افتراقی، از نرمافزار DESeq2 در محیط R استفاده شد.
(https://bioconductor.org/packages/release/bioc/html/ DESeq2.html) که فایل ورودی این نرمافزار در واقع همان فایل خروجی نرمافزار FeatureCounts است که به صورت یک ماتریس میباشد. این نرمافزار خوانشهایی که با هر بخش از یک ویژگی همپوشانی داشتند شمارش کرده و هر خوانشی را که با چندین ویژگی همپوشانی داشت، حذف مینماید. در نتایج حاصل از این نرم افزار، ژنهای دارای بیان افتراقی در افراد مبتلا به سرطان پستان از نوع سه گانه منفی در مقایسه با افراد سالم بدست میآیند. پس از یافتن Ensembl Gene ID برای ژنهای دارای بیان افتراقی، در پایگاه داده BioDBnet (https://biodbnet-abcc.ncifcrf.gov/ db/db2db.php) ، Gene Symbolها به دست آمده، در نهایت با اعمال فیلتر p-value <0.05 و <-0.05 تا <+0.05 Log2 در محیط پایتون ژنهای دارای بیان افتراقی معنادار مشخص شدند.
هستی شناسی ژن و و غنی سازی مسیر ژنهای با بیان متفاوت: برای انعکاس عملکردهای ژن، آنالیزهای هستی شناسی ژن انجام گرفت. (ToppFun)ToppGene (https://toppgene.cchmc.org/enrichment.jsp) یک پایگاه داده آنلاین است که مجموعهای جامع از منابع را برای حاشیه نویسی عملکردی ارائه میدهد تا اهمیت بیولوژیکی فهرست گستردهای از ژنها را تشخیص دهد [4]. آنالیزهای غنیسازی عملکردی ژنهای با بیان افتراقی، از جمله آنالیزهای هستی شناسی ژن و تحلیل غنیسازی مسیرهای درگیر آنها، در تحقیق حاضر، با استفاده از ToppGene با معیار cut-off p<0.05 و تعداد غنیسازی ژن بیشتر از 2 انجام شد.
نتایج
نتایج کنترل کیفیت دادهها: در تحقیق حاضر دادههای ترانسکریپتومی 7 نمونه انسانی شامل 3 نمونه سرطانی و 4 نمونه سالم مورد بررسی قرار گرفت که نتایج حاصل از کنترل کیفیت دادههای مربوطه، در شکل 1 (فایل پیوست شکل های 1-6) نشان داده شده است.
نتایج مربوط به همردیفی خوانشها با ژنوم مرجع: نتایج مربوط به همردیفی خوانشها با ژنوم مرجع که با استفاده از نرمافزار STAR انجام گردید در جدول 2 قابل مشاهده است، درصد Mapping ، عمق خوانش و طول خوانشهای حاصله برای هر کدام از دادهها حاکی از همردیفی مناسب آنها میباشد.
شکل 1- نمودارهای مربوط به کنترل کیفیت خوانشها در نمونه shC-1. الف) وجود و یا عدم وجود آداپتور؛ ب) مضاعف شدگی؛ ج) توالیهای با پیچیدگی پایین؛ د) بازهای مبهم؛ ه) کیفیت خوانش؛ و) درصد بازهای فراخوانده شده؛ ز) تعداد خوانشها در مقابل درصد GC؛ ح) تعداد کل خوانشها در مقابل متوسط نمره کیفیت و ط) توزیع طول خوانشها.
جدول 2- نتایج Mapping با استفاده از نرمافزار STAR
|
نام نمونه |
بیمار/سالم |
*درصد Mapping |
طول خوانش |
عمق خوانش** |
|
shC-1 |
سالم |
92.26% |
59664908 |
7.80 |
|
shC-2 |
سالم |
91.94% |
55775450 |
7.33 |
|
shC-3 |
سالم |
92.04% |
44287158 |
6.17 |
|
shC-4 |
سالم |
92.64% |
59096936 |
7.75 |
|
shMETTL18-1 |
بیمار |
91.25% |
61992298 |
7.59 |
|
shMETTL18-2 |
بیمار |
92.68% |
53128374 |
7.36 |
|
shMETTL18-3 |
بیمار |
93.54% |
61429524 |
7.76 |
* درصد خوانش های هم ردیف شده با ژنوم مرجع
** تعداد خوانش های کوتاهی که در یک منطقه ژنومی خاص روی یکدیگر همپوشانی دارند.
نتایج حاصل از آنالیز بیان افتراقی: فایلهای BAM، پس از مرتبسازی، با استفاده از نرمافزار FeatureCount ارزیابی شدند. بعد از مرتبسازی نتایج اولین مرحله از تجزیه و تحلیل دادهها در نرم افزار FeatureCount، این نتایج با استفاده از نرم افزار DESeq2 جهت شناسایی ژنهای دارای بیان افتراقی، آنالیز شدند.
در مجموع نتایج حاصل از آنالیز بیان افتراقی ژن، 9201 ژن با بیان متفاوت را نشان داد که به کمک پایگاه داده BioDBnet ، Gene Symbol آنها یافت شد. برای نمایش بیان افتراقی ژنها از نمودار Volcano استفاده شد (شکل 2). در این نمودار برای نمایش ژنهای با بیان متفاوت از سه طیف رنگی استفاده شد. نقاط سبز رنگ نمایانگر ژنهای با افزایش بیان معنادار با اعمال فیلتر p-value <0.05 و Log2 > 0.01 ، نقاط قرمز رنگ، ژنهای با کاهش بیان معنادار با اعمال فیلتر p-value <0.05 و Log2 > -0.01 است. در نهایت، نقاط آبی رنگ مربوط به ژنهایی با p-value نامناسب میباشند ( p-value >0.05 ). به عبارتی دیگر، ژنهایی که در این طیف رنگی قرار گرفتهاند (رنگ آبی) به طور معنادار دچار افزایش یا کاهش بیان نشدهاند.
بررسی میزان log2 fold Change و p-value (p-value <0.05 و <-0.05 تا <+0.05 Log2) به عنوان دو معیار اصلی در تفکیک ژنهای با بیان متفاوت نشان داد که از میان 9201 ژن، 31 ژن سطح بیان متفاوتتری را بر اساس دامنهای که تعیین شد، داشتهاند. قابل ذکر است که با تغییر این دامنه که در برخی مقالات هم اشاره شده است، میتوان ژنهای با تفاوت بیان بیشتری را شناسایی کرد. در این تحقیق، از دامنهی سختگیرانهای برای این آنالیز استفاده شد (<-0.05 تا <+0.05 Log2) و نتیجه حاصل به صورت نمودار ستونی نمایش داده شد (شکل 3). از این 31 ژن، 11 ژن کاهش بیان معنادار نشان دادند که با رنگ قرمز و 20 ژن هم افزایش بیان معنادار نشان دادند که با رنگ آبی در نمودار نمایش داده شدند.
شکل 2- نمایش بیان افتراقی ژنها با استفاده از نمودار Volcano. در این نمودار بیان افتراقی ژنها با استفاده از دو پارامتر p-value و Log2 نمایش داده شد.
شکل 3- شناسایی 31 ژن با بیان متفاوت با اعمال دو فیلتر log2 fold Change و p-value . 11 ژن به رنگ قرمز دچار کاهش بیان معنادار و 20 ژن به رنگ آبی دچار افزایش بیان معنادار . * نمایانگر 10 ژن با تفاوت بیان متفاوتتری نسبت به سایر ژنها
در بین این 31 ژن، با اعمال فیلتر سختگیرانهای، 10 ژن تفاوت بیان متفاوتتری نسبت به سایر ژنها داشتند. به طوری که پنج ژن RP11-762L8.6، lnc-RHBDD1-3، LINC00624، SGPP2 و AP000866.2 بیشترین میزان بیان یا به عبارتی بالاترین سطح بیان معناداری و پنج ژن CACNA1S، CXCL5، CCL20، NEURL3 و DEFB4A کمترین میزان بیان یا به عبارتی پایینترین سطح بیان معناداری را نشان دادند (شکل 3).
نتایج مربوط به تجزیه و تحلیل های هستی شناسی ژن: تجزیه و تحلیل هستی شناسی برای 31 ژن تمایز یافته برتر مشخص کرد که ژن های تمایز یافته به طور قابل توجهی در فرآیندهای بیولوژیکی و مکانیسمهای مولکولی موثر در سرطان پستان از جمله فرآیندهای مرتبط با پاسخ سلولی، رشد و تکثیر سلولی، آپوپتوز، فرآیندهای متابولیسمی، فرآیندهای مرتبط با چرخه سلولی، تولیدمثل و پاسخهای ایمنی درگیر هستند (جدول 3).
بحث و نتیجهگیری
سرطان پستان از نوع منفی - سه گانه نوع پیشروندهای از این بیماری است که امروزه فاقد نشانگرهای زیستی موثر و اهداف درمانی مورد نیاز برای مطالعات تشخیصی و درمانی میباشد. سرطان پستان از نوع منفی سه گانه، مسئول تقریبا 15 درصد تمامی سرطانهای پستان تهاجمی است. امروزه به دلیل عدم شناخت کافی در مورد مکانیسمهای مولکولی و عملکردی و اهداف درمانی، شیمی درمانی عمدهترین روش برای درمان این نوع از سرطان است. بنابراین، نیاز جدی به شناسایی نشانگرهای درمانی و تشخیصی میباشد [1،2،13]. روشهای نوینی همانند ریزآرایه و تکنیکهای توالی یابی عمیق، تغییرات مولکولی گستردهای را در این بیماری ایجاد نموده و منجر به پیشرفت قابل توجهی در کارهای بالینی شده است. در سالهای اخیر، توالی یابی RNA به عنوان یک فن آوری جدید برای تجزیه و تحلیل ترانسکریپتوم با توان بالا مطرح شده است. بسیاری از مطالعات، ترانسکریپتهای دارای بیان افتراقی را شناسایی نموده و به عنوان نشانگرهای زیستی مستعد در طبقه بندی زیرگروههای سرطان معرفی نمودهاند که میتواند برای شناسایی و درمان این بیماری تهاجمی و پیشرونده بسیار مفید و ارزشمند باشد [26]. در این مطالعه، یک تجزیه و تحلیل افتراقی جامعی بر روی دادههای ترانسکریپتوم افراد مبتلا به سرطان پستان از نوع سه گانه - منفی در مقایسه با افراد سالم انجام گرفت. نتایج حاصل از مطالعه 7 داده شامل 3 فرد مبتلا به سرطان پستان و 4 فرد سالم، در نهایت منجر به شناسایی 31 ژن دارای بیان افتراقی با سطح معنی داری p<0.05 شد. در بین این 31 ژن، 11 ژن کاهش بیان و 20 ژن افزایش بیان نشان دادند. ارزیابیهای بیشتر این ژنها حاکی از نقش مهم و کلیدی آنها در مکانیسمهای مولکولی درگیر در بیماریزایی سرطان پستان بود.
جدول 3- گزیدهای از تجزیه و تحلیل هستی شناسی برای 31 ژن تمایز یافته برتر حاصل از آنالیز بیان افتراقی
|
شماره هستی شناسی ژن |
تعداد ژن درگیر |
تعداد ژنهای مسیر مولکولی |
مسیر مولکولی |
ژنهای منتخب |
|
|
0.051499296 |
1 |
11 |
فعالیت کانال کلسیم با ولتاژ بالا |
CACNA1S |
|
|
0.056749282 |
1 |
14 |
اتصال اسیدهای چرب با زنجیره بلند |
FABP4 |
|
|
0.064075348 |
1 |
18 |
فعالیت ناقل اسیدهای چرب با زنجیره بلند |
FABP4 |
|
|
0.065610489 |
3 |
784 |
فعالیت مولکول ساختاری |
CRYBG3 ZP4 FLG2 |
|
|
0.065610489 |
1 |
26 |
اجزای ساختاری عدسی چشم |
CRYBG3 |
|
|
0.084538781 |
1 |
35 |
اتصال به گیرنده های هورمونی |
FABP4 |
|
|
0.090458458 |
1 |
39 |
اتصال اسید چرب |
FABP4 |
|
|
0.091297792 |
4 |
1722 |
اتصال گیرنده سیگنال |
CCL20 CXCL5 FABP4 DEFB4A |
|
|
0.103076404 |
1 |
48 |
فعالیت کانال کلسیمی وابسته به ولتاژ |
CACNA1S |
|
|
0.106052014 |
1 |
53 |
A اتصال پروتئین کیناز |
CRYBG3 |
|
|
0.142314177 |
1 |
74 |
اتصال اسید مونو کربوکسیلیک |
FABP4 |
|
در مطالعه اخیر، ژن USP34 در افراد مبتلا به سرطان پستان از نوع سه گانه - منفی در مقایسه با افراد سالم افزایش 5 برابری نشان داد. بررسی و مطالعات انجام شده حاکی از این است که این ژن پپتیداز اختصاصی یوبی کوئیتین 34 است که بر روی کروموزوم 2 قرار گرفته است. یوبی کوئیتین یک پروتئین 76 اسیدآمینهای است که با اتصال به یکسری از پروتئینهای هدف و تجزیه آنها نقش مهمی در تنظیم فرآیندهای سلولی دارد. حال یوبی کوئیتین پروتئازها میتوانند در حذف این عامل از پروتئینهای هدف نقش داشته باشند. خانواده ژنی پروتئازهای اختصاصی یوبی کوئیتین، یکی از کلاسهای مهمی از پروتئازها در انسان هستند. پروتئاز اختصاصی یوبی کوئیتین UPS34 میتواند نوع خاصی از آنزیم جدا کننده یوبی کوئیتین را رمزگذاری کند [12]. مطالعات زیادی به نقش حیاتی پپتیدازهای اختصاصی یوبی کوئیتین در پیشرفت سرطان اشاره نمودهاند [24]. همچنین، بر اساس مطالعات قبلی چندین مسیر مهم مرتبط با سرطان توسط اعضای مختلف UPS تنظیم میشوند که از جمله آنها میتوان به مسیرهای JAKs-STATs ، مسیر NF-kB ، مسیر TGFB و مسیر Wnt اشاره نمود. مطالعات حاکی از نقش مهم UPS34 در مسیر پیام رسانی Wnt است [24]. از این رو می توان ژن UPS34 را به عنوان نشانگر زیستی احتمالی مهم در سرطان پستان معرفی نمود و با طراحی مهارکنندههای موثر علیه آن از پیشرفت سرطان جلوگیری نمود. ژن دیگری که در مطالعه کنونی به عنوان یک نشانگر زیستی احتمالی شناسایی گردید، ژن CRYBG3 بود. این ژن به صورت معنی داری در افراد مبتلا به سرطان پستان در مقایسه با افراد کنترل افزایش معناداری نشان داد. تجزیه و تحلیلهای هستی شناسی ژن و بررسی منابع حاکی از نقش مهم و تعیین کننده این ژن در مکانیسمهای مولکولی درگیر در بیماریزایی افراد مبتلا به سرطان پستان بود که تاییدی بر یافتههای این مطالعه بود. نقش مهم ژن CRYBG3 به این صورت است که این ژن میتواند با یک آنزیم مهم فرآیند گلیکولیز به نام لاکتات دهیدروژناز برهمکنش داشته باشد. مطالعات انجام شده توسط چن و همکاران در سال 2018، افزایش بیان هماهنگ این دو ژن را در افراد مبتلا به سرطان ریه گزارش نمودند [3]. ژن CRYBG3 به عنوان تنظیم کننده گلیکولیز است و افزایش بیان آن باعث جذب گلوکز و تولید لاکتات میشود و این در حالی است که ناک داوون آن نتایج معکوسی را نشان داده و باعث مهار تکثیر سلولی میگردد. بنابراین میتوان گفت که ژن CRYBG3 میتواند به عنوان یک نشانگر زیستی احتمالی مهم در تشخیص و پیش آگهی افراد مبتلا به سرطان بوده و هدف گیری آن میتواند گامی در جهت درمان این بیماری پیچیده باشد [23].
یکی از ژنهایی که در این مطالعه دچار کاهش بیان شد، ژن FABP4 بود. کاهش 5 برابری این ژن با سطح معنی داری p<0.05 در افراد مبتلا به سرطان پستان در مقایسه با افراد سالم مشاهده شد. پروتئین متصل شونده به اسید چرب آدیپوسیت (FABP4) به وفور در ماکروفاژها و سلولهای آدیپوسیت وجود دارد. با توجه به فراوانی این پروتئین در این دسته از سلولها، نظر بر این است که FABP4 در متابولیسم لیپید نقش دارد. طبق مطالعات انجام شده توسط ژانک و همکاران (2018)، نقش پروتئین FABP4 در بسیاری از سرطانها از جمله سرطان ریه، سرطان پستان، سرطان تخمدان و سرطان پروستات گزارش شده است. این پروتئین میتواند به لیگاندهای لیپیدی هیدروفوب متصل گردد و در تنظیم متابولیسم گلوکز و لیپید نقش داشته باشد. همچنین نقش مهمی در پیام رسانی درون سلولی ایفا میکند [25]. نتایج حاصل از تجزیه و تحلیلهای هستی شناسی ژن و یکسری از مطالعات حاکی از تاثیر تعیین کننده این پروتئین بر روی فرآیند تکثیر سلولی و آپوپتوز میباشد. علاوه براین، گزارش شده که هر گونه کاهش بیان در این پروتئین کاملا مرتبط با سایز توموری هست که مورد مطالعه قرار گرفته است و افزایش بیان آن با القای ژن خارجی منجر به مهار تکثیر و مهاجرت سلولهای توموری شده است [25]. با توجه به اینکه تشخیص و شناسایی بیماری سرطان یکی از معظلات امروزه پزشکان و متخصصان میباشد، شناسایی ژن مهم و کلیدی FABP4 میتواند بسیار ارزشمند باشد. یکی دیگر از نشانگرهای کلیدی و مهم گزارش شده در این مطالعه، ژن RNF223 بود. نتیجه حاصله برای این ژن کاهش بیان معنی دار آن در افراد مبتلا به سرطان پستان در مقایسه با افراد سالم بود. ژن RNF223 بر روی کروموزوم 1 واقع شده است و پروتئین حاصل از آن با داشتن یک دومین انگشت حلقه نقشی کلیدی در مسیر یوبی کویتینه شدن دارد. بسیاری از پروتئینهای دارای این دومین، میتوانند به اهداف مولکولی خود متصل گردند و عملکرد آنها را تنظیم کنند. از جمله اهداف این پروتئینها میتوان به مولکولهای DNA، RNA، پروتئین و یا ساختارهای لیپیدی اشاره نمود. زوآ و همکاران (2019) در مطالعهای که با هدف بهبود تشخیص در بیماری سارکوما انجام دادند، به نقش مهم و تعیین کننده ژنهای FGF23، TLX2، TIFAB، RNF223، HIST1H3A و AADACL4 پی بردند. آنالیزهای عملکردی با کیفیت بالایی که این محققین انجام دادند، در نهایت منجر به معرفی این 6 ژن شد که دارای نقش حیاتی در فرآیندهای بیولوژیکی مرتبط با سرطان بوده و در بهبود تشخیص این بیماری پیچیده میتوانند بسیار کمک کننده باشند [21]. با توجه به نقش مهم این پروتئین در فرآیند مهم یوبی کوتئینه کردن پروتئینهای هدف، کاهش بیان آن میتواند منجر به بهم ریختن تنظیم مسیرهای مولکولی مختلف درگیر در داخل بدن شود و اثرات جبران ناپذیری داشته باشد. از این رو شناسایی چگونگی عملکرد این پروتئین و تشخیص زودهنگام آن میتواند در امر تشخیص و پیش آگهی مفید باشد.
ژن دیگری که در نتایج حاصل از این مطالعه به عنوان نشانگر زیستی احتمالی معرفی شد، ژن ETV3L بود. این ژن در تجزیه و تحلیلهای انجام شده کاهش بیان معنی داری (5 برابری) نشان داد. بررسیهای انجام شده در بانکهای اطلاعاتی، حاکی از وجود این ژن در موقعیت 1q23.1 با 20790 جفت باز بود که از نظر عملکردی نقش مهمی در بسیاری از فرآیندهای درون سلولی داشت. فاکتورهای نسخه برداری ETS ، بیان ژنهای درگیر در تکوین طبیعی سلولی ، تکثیر، تمایز، رگ زایی و آپوپتوز را تنظیم میکنند. این دسته از فاکتورها دارای 28 عضو هستند که ژن ETV3L به عنوان یکی از اعضای مهم این ابرخانواده ژنی میباشد. عدم تنظیم این فاکتورهای نسخه برداری، تکثیر سلولی در انواع مختلف سرطانها را تسهیل میکند و چندین عضو آنها با فعال کردن نسخه برداری ژنهای خاصی در تهاجم و متاستاز نقش دارند. 28 عضو شناسایی شده از این خانواده ژنی تا به امروز دارای یک توالی اسیدآمینهای حفاظت شده به نام دومین ETS هستند که تقریبا دارای 85 اسید آمینه بوده و یک دومین متصل شونده به DNA در انتهای کربوکسیلی ایجاد میکنند که برای شناسایی توالی هدف GGAA/T (جایگاه متصل شونده به ETS) ضروری میباشد. فاکتورهای نسخه برداری ETS از جمله ETV3L با اتصال به نواحی متصل شونده به DNA، میتوانند در فرآیندهای دیگری مثل تکوین سلولهای بنیادی، تکثیر سلولی، تمایز، رشد سلولی، ترانسفورماسیون، رگ زایی و آپوپتوز نقش داشته باشند. این فاکتورها پروتئینهای افکتوری پایین دستی مسیرهای مولکولی مهم درون سلولی از جمله مسیرهای RAS/ RAF/ ERK هستند که مسیرهایی مهم در فرآیندهای فوق میباشند. به گونهای که ارتباط سطح بیان ژنهای ETS با پیشرفت تومور در بسیاری از نئوپلازیایی انسانی شامل لوکمیا، تیروئید، پانکراس، کبد، پروستات، کلون، ریه و سرطان پستان مشاهده شده است که هر گونه تغییر بیان در آنها میتواند باعث تغییر در ژنهای هدف پاسخ دهنده شود. [7]. NEURL3 ، از دیگر ژنهای شاخص معرفی شده در این مطالعه است. این ژن کاهش بیان 6 برابری در افراد مبتلا به سرطان در مقایسه با افراد کنترل نشان داد. مطالعات حاکی از نقش مهم پروتئین حاصل از این ژن در تکوین غدد پستانی و به تبع سرطان پستان بود. خانواده ژنی نوروگلین، لیگاندهای شامل EGF را رمزگردانی میکنند که قادرند با اتصال به پذیرندههای تیروزین کینازی در شبکههای پیام رسانی مهم در مسیر تکوین غدد پستانی و سرطان پستان بسیار مهم و تاثیرگذار باشند [16]. نتایج حاصل از تجزیه و تحلیلهای هستی شناسی ژن و مطالعات مختلف حاکی از نقش مهم پروتئین NEURL3 در مراحل مختلف ریخت زایی و اختصاصی شدن سلولهای پستانی در مراحل جنینی هست. مطالعات اخیر نشان دادهاند که هر گونه تغییر در میزان تولید این پروتئین مهم میتواند نقش بسیار تعیین کنندهای در شکل گیری این سلولهای مهم در بافت پستانی داشته باشد. مطالعات لی و همکاران (2017) و گاتناتی و همکاران (2020) موید این نتایج و اطلاعات است [16,9]. نشانگر زیستی احتمالی مهم دیگری که در مطالعه کنونی گزارش شد، ژن CACNA1S بود [20]. نتایج حاصله کاهش معنی دار این ژن در افراد مبتلا به سرطان پستان در مقایسه با افراد سالم را نشان داد. مطالعه صورت گرفته توسط فان و همکاران در سال 2017 به اهمیت این ژن اشاره نموده و آن را به عنوان یکی از اهداف جدیدی برای درمان سرطان معرفی کردند [17]. ژن CACNA1S یکی از اعضای مجموعه ژنی کانالهای کلسیمی وابسته به ولتاژ میباشد که این کانالها دارای نقشهای تایید شدهای در فرآیندهای سلولی مثل میتوژنز، تکثیر سلولی، تمایز، آپوپتوز و متاستاز هستند [18]. در گزارشی ارتباط بین این دسته ژنی و کاهش در تکثیر و افزایش آپوپتوز در سرطان پروستات مطرح شده است که به دلیل کاهش بیان این ژنها و هدف گیری آنها گامی مهم در جهت درمان بیماری سرطان برداشته شده است. بیان ترانسکریپتهای کانالهای یونی به عنوان نشانگرهای زیستی مستعدی در انواع مختلف سرطان مثل سرطان پروستات و سرطان پستان مطرح شده است. بنابراین مطالعه نقشهای عملکردی این کانالهای یونی در مراحل تکوین سرطان ممکن است اهداف ارزشمندی برای تشخیص تومور مشخص نماید که نتایج حاصل از تجزیه و تحلیلهای هستی شناسی ژن نیز به این امر اشاره داشت. به دلیل نقش مهم کلسیم و کانالهای یونی وابسته به این یون در فرآیندهای درون سلولی و مکانیسمهای مولکولی تعیین کننده سلولی، معرفی این ژن مهم میتواند ارزش بالینی خیلی بالایی داشته باشد [18].
در این مطالعه، تجزیه و تحلیلهای انجام شده بر روی دادههای ترانسکریپتوم افراد مبتلا به سرطان پستان از نوع سه گانه - منفی در مقایسه با افراد سالم نتایج ارزشمندی را نشان داد. نتیجه این مطالعات، شناسایی 31 ژن دارای بیان افتراقی با سطح معنی داری p<0.05 بود. در بین این 31 ژن، 11 ژن کاهش بیان و 20 ژن افزایش بیان نشان دادند. از جمله ژنهای شاخص این مجموعه ژنی یافت شده میتوان به ژنهای RNF223، ETV3L، CACNA1S، UPS34، NEURL3، CRYBG3 و FABP4 و سایر ژنهای مهمی مثل CCL20، CXCL5، CEP295 و FLG2 اشاره نمود. بررسی و مطالعات انجام شده در مورد این ژنها حاکی از نقش مهم آنها در مسیرها و فرآیندهای مولکولی درگیر در بیماریزایی افراد مبتلا به سرطان پستان بود. از جمله فرآیندهایی که این ژنها دخیل هستند، میتوان فرآیندهای تکثیر سلولی، تنظیم متابولیسم گلوکز و لیپید، آپوپتوز، پیام رسانی درون سلولی، تمایز، تکوین، تنظیم کانالهای وابسته به یونها، ترانسفورماسیون، رگ زایی و اتصالات سلولی را نام برد. بنابراین معرفی این نشانگرهای زیستی مهم در مکانیسمهای مولکولی حیاتی سلولها میتواند برای اهداف تشخیصی، درمانی و پیشگیری بسیار با اهمیت و منحصر بفرد باشد که البته نیازمند مطالعات گستردهتر برای تایید نتایج کنونی است.
تضاد منافع
نویسندگان اعلام میکنند که هیچ تضاد منافعی ندارند.