تخمین دقیق نواحی کدکننده پروتئین در ژن ها با استفاده از ابزارهای پردازش سیگنال، در سال های اخیر به چالشی در بیوانفورماتیک تبدیل شده است. بسیاری از روش های پردازش سیگنال های ژنومیک بر مبنای خاصیت تناوب 3 بازهای موجود در رشته های DNA متمرکز بوده و سپس تحلیل های طیفی بمنظور یافتن موقعیت مولفه های متناوب بر روی توالی های عددی DNA اعمال می شود. در این مقاله با استفاده از پنجره با طول متغیر و بر مبنای منحنی Z، الگوریتمی بمنظور تعیین نواحی کدکننده پروتئین ارائه می کنیم. منحنی Z، یک منحنی سه بعدی منحصربفرد برای نمایش توالی DNA می باشد که توصیف کاملی از رفتار بیولوژیکی توالی DNA را بدست می دهد. الگوریتم پیشنهادی بدلیل استفاده از پنجره گوسی با طول قابل تنظیم، از رزولوشن و دقت بسیار بالایی در تخمین نواحی ژنی برخوردار بوده و نواحی غیرپروتئینی در آن کاملا حذف می شود. همچنین بمنظور استخراج مولفه تناوب 3 از یک فیلتر میانگذر باند محدود با فرکانس مرکزی 2π/3 استفاده می نماییم. الگوریتم پیشنهادی ابتدا بر روی توالی F56F11.4 در C.elegans اعمال و نتایج آن با سایر روش های موجود مقایسه شده و سپس آنرا بترتیب برروی ژن های موجود در دو پایگاه داده HMR195 و BG570 اعمال می نماییم.
بازنشر اطلاعات | |
این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است. |