ביואינפורמטיקה

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
מפת כרומוזום X אנושי (מתוך אתר NCBI). מיפוי גנום האדם הוא אחד מהישגי הביואינפורמטיקה.

ביואינפורמטיקה (באנגלית: Bioinformatics), (ביולוגיה חישובית) עוסקת בחקר המידע הביולוגי באמצעות מחשב. זהו ענף מדע העוסק בניתוח, ארגון והבנה של המידע השאוב מנתונים ביולוגים. הביואינפורמטיקה מיישמת כלים מתחום מדעי המחשב, המתמטיקה, הסטטיסטיקה ותורת המידע לשם עיבוד מידע ביולוגי רחב היקף. כלים אלה כוללים מודלים מתמטיים, אלגוריתמים ותוכניות מחשב, שמתאפיינים בהתמודדות עם מאגרי מידע גדולים, בעיות בסיבוכיות גבוהה, וחיפוש אחר תבניות.

תחום מדעי זה החל להתפתח הן בזכות זמינותם של מאגרי מידע ביולוגיים הולכים וגדלים (כגון: GenBank‏, EMBL‏, NCBI‏ ו-PubMed), והן בזכות פיתוחים טכנולוגיים בתחום חומרת המחשב, בתחום האלגוריתמים ובתחום מסדי הנתונים המאפשרים התמודדות ראויה עם אתגרים.

תחומי הביואינפורמטיקה

הביואינפורמטיקה עוסקת בנושאים מגוונים:

עץ פילוגנטי מבוסס על נתוני rRNA ובו נראית ההפרדה בין חיידקים, חיידקים קדומים, ואיקריוטיים
  • בניית עצים פילוגנטיים המצביעים על דמיון בין אורגניזמים. בניית עץ פילוגנטי הייתה נעשית בעבר על פי תכונות חיצוניות של אורגניזמים שונים, ובעשור השני של המאה ה-21, היא נעשית על פי הבדלים ברצף ה-DNA בין גנים דומים באורגניזמים שונים.
  • סימולציה של תהליכים ביולוגיים באמצעות תוכנת מחשב.
  • ניתוח מידע באשר לביטוי של גנים, המופק על ידי שבבי DNA - שבבי DNA מאפשרים לדגום את תמונת המצב של הביטויים של רבבות גנים ברקמה מסוימת (מדידת רמת ה-RNA של הגנים). מידע המגיע משבבי DNA שהופקו מקבוצה של מספר אוכלוסיות שונות מאפשר לזהות גנים, אשר מעורבים במצבים שונים המפרידים בין האוכלוסיות השונות (למשל: בריאים לעומת חולים בסרטן, או אוכלוסיות החולות בסוגים שונים של סרטן, או אוכלוסיות המגיבות באופן שונה לתרופה מסוימת).
  • רשתות ביולוגיות - מאפשרות בניית מיפוי של אינטראקציות בין גנים, חלבונים ומולקולות בקרה באורגניזם מסוים.

עם מקורות המידע הזמינים לניתוח ביואינפורמטי נמנים:

  • המידע השאוב מפרויקט הגנום ומפרויקטים דומים אחרים, המביאים לזמינותם של רצפי DNA של קבוצה הולכת וגדלה של אורגניזמים.
  • מבנים תלת־ממדיים של חלבונים וחומצות גרעין (DNA ו-RNA)
  • תבניות התבטאות גנים תאיות
  • סקירות מגע בין חלבוני

בנוסף למחקר התאורטי הנרחב ולהעמקת בסיס הידע הביולוגי, טמון בביואינפורמטיקה פוטנציאל טיפולי-קליני: בגילוי ואבחון מחלות גנטיות מולדות, באבחון מוקדם של מחלות נרכשות עם בסיס גנטי מובהק כדוגמת הסרטן ואף בפיתוח תרופות.

שפות תכנות כמו Perl ופייתון הפכו לכלי עיקרי ליישומי ביואינפורמטיקה, ובעקבותיהן קמו מיזמים כגון ביופייתון וביופרל (באנגלית: BioPerl) הכוללים אוסף של אלגוריתמים לתחום זה.

שיטות בביואינפורמטיקה

עימוד רצפים

עימוד רצפים (באנגלית: Sequence Alignment) מתייחס לשיטות ממוחשבות המאפשרות להעמיד מספר רצפי DNA,‏ RNA או חלבון שונים זה מעל זה באופן שידגיש דמיון בין הרצפים. דמיון עשוי להעיד על קשרים במבנה או בתפקוד.

באמצע העשור השני של המאה ה-21, זמינים בידינו רצפי ה-DNA של קבוצה הולכת וגדלה של אורגניזמים. חלקים גדולים מהגנום קיימים ללא שינוי בין אורגניזמים שונים.

ניתוח ביטוי גנים (Gene Expression Analysis)

מטריצת ביטוי גנים
שני שבבי DNA

טכנולוגיות שונות כגון שבבי DNA‏ או RNA-Seq, מאפשרות לדגום את רמת הביטוי של אלפי גנים בו זמנית בעזרת מדידת כמות מולקולות ה-RNA שליח השונות בדגימה ביולוגית מסוימת.

מרבית הגנים בתא אינם מבוטאים - כלומר, אינם משועתקים מ-DNA ל-RNA שליח (אשר בדרך כלל מתורגם לבסוף לבניית חלבון). קבוצה קטנה של גנים מבוטאת במרבית סוגי התאים (House Keeping Genes - גנים הנחוצים לתחזוקה בסיסית של מרבית התאים), וקבוצה אחרת של גנים מתבטאת רק בתאים מסוג מסוים (למשל גן ההמוגלובין מתבטא באופן נורמלי רק בתאי דם אדומים). על כן, מדידת רמות הביטוי של גנים ברקמה נתונה מאפשרת ללמוד על מצבו של התא בזמן נתון - גן מסוים עשוי להתבטא ברמות שונות על פי סוג הרקמה (עור, דם, מוח), מצב התא (בתגובה לזיהום, בעת פעילות כלשהי) או במחלות מסוימות (תא סרטני יבטא גנים באופן שונה מרקמה נורמלית של אותו סוג תא).

בניתוח ביטוי גנים, נעשה שימוש באלגוריתמים שונים המאפשרים לזהות דפוסי ביטוי של גנים המבחינים בין קבוצות שונות של דגימות. אחד האתגרים בניתוח ביטוי גנים הוא הרעש הביולוגי ורעש המדידה שנלווה לסוג זה של ניסויים, מה שמצריך שימוש בשיטות סטטיסטיות ואלגוריתמיות להבחנה בין סיגנל לרעש.

פעמים רבות ננסה למצוא גנים אשר מתבטאים באופן שונה בין שתי קבוצות של דגימות. למשל: ניתן לקחת 10 דגימות של רקמת מוח בריאה, ו-10 דגימות מגידול סרטני במוח, ולנסות למצוא גנים אשר מתבטאים במידה מועטה בכל הדגימות הבריאות, ובמידה רבה בכל הדגימות הסרטניות (או להפך). גנים כאלו עשויים לאפשר ללמוד על התהליך הביולוגי העומד מאחורי המחלה הנחקרת (אם אכן יש הבדל מובהק בין רמת הביטוי של גנים אלו בשתי האוכלוסיות, אזי סביר שהחלבונים אשר גנים אלו מקודדים, מעורבים בהיווצרות המצב הביולוגי שמבדיל בין שתי האוכלוסיות). אנליזה מסוג זה תכלול לרוב שימוש במבחנים סטטיסטיים המשווים ממוצע בין 2 קבוצות.

במקרים אחרים, ננסה למצוא דגימות אשר דומות אחת לשנייה מבחינת רמות הביטוי של קבוצת גנים מסוימת. למשל: אם נתונה קבוצה של 100 דגימות סרטן השד, נוכל לנסות ולקבץ את הדגימות לתת סוגים בעלי משמעות קלינית על פי רמות ביטוי הגנים בדגימות השונות. אנליזה מסוג זה תכלול אלגוריתמים ללמידה בלתי מונחית (Unsupervised learning) כגון אלגוריתמי קיבוץ (clustering), אשר מציבים זה ליד זה גנים (או דגימות) בעלי דפוס ביטוי דומה.

ראו גם

קישורים חיצוניים

הערות שוליים

  1. ^ "A map of human genome variation from population scale sequencing". Nature. 467: 1061–1073. 2010-10-28. doi:10.1038/nature09534.
  2. ^ J. Craig Venter, Karin Remington, John F. Heidelberg, Aaron L. Halpern, Environmental Genome Shotgun Sequencing of the Sargasso Sea, Science 304, 2004-04-02, עמ' 66–74 doi: 10.1126/science.1093857


Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0