Курс лекцій
18. Способи оцінки фенотипової схожості та умови відповідності між коефіцієнтами кореляції та коефіцієнтами родинної схожості
Отже, схожість між родичами виникає, з одного боку, за рахунок загальних генів, а з іншого боку, за рахунок загального середовища. Щоб кількісно оцінити ступінь схожості в парах родичів, найчастіше використовують конкордантність і кореляцію. У деяких випадках користуються також регресією.
Конкордантність
При аналізі схожості/відмінності альтернативних ознак використовують оцінки конкордантності. Найчастіше оцінки конкордантності використовуються в клінічній психогенетиці при вивченні причин різних психічних захворювань або відхилень у розвитку. Пари родичів називаються конкордантними, якщо обидва мають або не мають цей показник. Відповідно, дискордантними називаються пари, в яких один має дану ознаку, а інший – ні. Для оцінки конкордантності підраховується відсоток збігу альтернативних ознак в парах родичів. Ті індивіди, які володіють ознакою що нас цікавить називаються пробандами.
Дослідженню підлягають пробанди і їх родичі різного ступеня споріднення (близнюки, сібси, батьки, діти і т. ін.). Наприклад, при вивченні спадковості шизофренії як пробанди можуть підбиратися хворі близнюки, як монозиготні, так і дизиготні. Припустимо, в такому дослідженні було виявлено, що для 20 пробандів (монозиготних близнюків), хворих на шизофренію, в 15 випадках був хворий і партнер пробанда, тобто пари виявилися конкордантні за шизофренією, тоді як в останніх 5 парах (дискордантних за шизофренією) партнери виявилися здоровими. В даному випадку конкордантність (С) дорівнює:
СМЗ = (15/20) 100 = 75%.
У той же час з 20 пробандів дизиготних близнюків лише у 10 виявився хворий і інший член пари, тобто на 10 конкордантних довелося стільки ж дискордантних пар. В цьому випадку конкордантність дизиготних близнюків дорівнює:
СДЗ = (10/20) 100 = 50%.
В результаті такого дослідження можна зробити висновок, що ризик захворювання на шизофренію вище для родичів, пов'язаних більш тісною спорідненістю, тобто тих, що мають більше загальних генів. Якщо результати схожих досліджень виявляються статистично достовірними, можна припускати наявність спадкової обумовленості захворювання.
Коефіцієнти конкордантності допомагають визначити ризик захворюваності для різних категорій родичів. Наприклад, якщо для сібсів конкордантність по шизофренії становить 10%, можна вважати, що ризик захворювання на шизофренію у людини, що має брата чи сестру, які страждають цим захворюванням, складе 1 на 10 випадків. Як правило, конкордантність для родичів порівнюється з проявом хвороби в популяції. Наприклад, якщо було виявлено, що захворюваність на шизофренію для родичів першого ступеня споріднення становить 10%, а в популяції випадків цієї хвороби всього 1%, можна казати про більш високий ризик захворювання у родичів.
Зіставлення оцінок конкордантності монозиготних і дизиготних близнюків дає можливість оцінити частку впливу спадкових чинників на варіативність досліджуваної ознаки, тобто коефіцієнт успадковання h2. Для цього можна скористатися формулою Хольцингера:
h2 = (СМЗ - СДЗ) / (100 - СДЗ) = (75 - 50) / (100 - 50) = 0,5.
Отже, в наведеному прикладі коефіцієнт успадковування (в широкому сенсі слова) дорівнює 0,5.
Кореляція
При аналізі кількісних ознак схожість між родичами оцінюється за допомогою кореляції.
У статистиці коефіцієнт кореляції зазвичай використовується для оцінки міри зв'язку між двома показниками. Так, можна, наприклад, поставити запитання, чи існує зв'язок між двома кількісними ознаками у людини, наприклад, між густотою волосся і щільністю. Тут можливі три варіанти:
1) чим густіше волосся, тим вища щільність,
2) чим густіше волосся, тим щільність нижче,
3) ці ознаки ніяк не пов'язані між собою.
Якщо вірно останнє твердження, то ми б сказали, що ці ознаки не корелюють. У першому випадку можна говорити про позитивну кореляцію, у другому – про негативну. Основний принцип підрахунку кореляції полягає в наступному. Візьмемо, наприклад, такі ознаки, як зріст людини і його вагу. Припустимо, що у групи індивідів ми провели відповідні вимірювання і занесли дані в таблицю. Розглядаючи таблицю, ми можемо помітити, що відхилення росту кожної людини від середньої величини прямо пропорційно таким же відхиленням, що належать до його ваги. У цьому прикладі зріст і вага демонструють максимальну позитивну кореляцію, величина якої дорівнює +1,0. Якщо ми розташуємо значення в одному з стовпців в зворотному порядку, то отримаємо негативну кореляцію з величиною коефіцієнту, що дорівнює -1,0. Якщо ми в випадковому порядку перемішаємо всі цифри, то кореляція буде близька до 0.
Графічно позитивна кореляція між двома величинами може бути представлена у вигляді лінії з позитивним нахилом, при цьому на осях Х і Y відкладаються значення ознак що корелюють; негативна кореляція може бути представлена у вигляді лінії з негативним нахилом, відсутність кореляції виражається у відсутності нахилу відповідної лінії. Таким чином, величина кореляції говорить нам про те, наскільки відхилення від середньої однієї величини збігаються з відхиленнями іншої. (Нагадаємо, що все, що пов'язано з відхиленнями від середніх величин – це область, близька до проблем варіативності і вимірам дисперсії). Односпрямований характер відхилень призводить до виникнення високої позитивної кореляції. Разом з тим величина коефіцієнта кореляції не несе ніякої інформації про абсолютні величини двох ознак. Поглянувши на таблицю, ми переконаємося, що в колонках цифр абсолютні значення росту і ваги відрізняються приблизно на сто одиниць. Дві змінні можуть ідеально корелювати одна з одною, навіть якщо кожне значення однієї значно більше, ніж кожне значення іншої. Ця обставина має безпосереднє відношення до розуміння значень кореляцій в оцінці схожості між родичами.
При оцінці схожості між родичами вимірюється не дві ознаки у одних і тих самих людей, а одна і та сама ознака в парах споріднених індивідів. Ними можуть бути близнюки, сібси, батьки і діти і навіть не родичі, що живуть в одній родині (маються на увазі родини з усиновленими дітьми) і т. ін. Принцип же підрахунку кореляцій такий же. Важливі не абсолютні величини ознак, а відхилення від середньої. Якщо відхилення односпрямовані, то і кореляція між родичами буде високою.
Залежно від типу родичів використовується той чи інший тип коефіцієнта кореляції. У тих випадках, коли оцінюється схожість між парами родичів, що належать різним поколінням (батько-дитина, дід-онук і т. ін.), використовують міжкласовий коефіцієнт кореляції, запропонований Карлом Пірсоном.
Для оцінки ступеня схожості між близнюками і сібсами використовується внутрішньокласовий коефіцієнт кореляції:
Отже, в генетиці поведінки мірою схожості між родичами найчастіше є кореляція, яка передбачає схожості в абсолютних величинах ознаки. Однак нерідко в повсякденному розумінні схожість між родичами ототожнюється зі схожістю в абсолютних або середніх величинах. Таке розуміння схожості може призводити до помилкової інтерпретації отриманих результатів.
Розглянемо гіпотетичний приклад, який ілюструє можливість виникнення деяких помилок з приводу ролі спадкових чинників і чинників середовища у виникненні індивідуальних відмінностей.
Припустимо, що група дітей з бідних сімей була усиновлена групою батьків з середніх або заможних верств суспільства. Батьки-усиновлювачі за своїм інтелектуальним потенціалом і матеріальними можливостями змогли забезпечити дітям ідеальні можливості для розвитку. Припустимо, що, коли діти виросли, було проведено вимір коефіцієнта інтелекту у самих дітей, а також у їх біологічних матерів і матерів-усиновлювачів. У цьому прикладі виходить ідеально висока позитивна кореляція (рівна +1) між дітьми і їх біологічними матерями, оскільки в обох цих групах спостерігається односпрямованість відхилень від середнього, що і створює високу позитивну кореляцію. Кореляція з матерями-усиновлювачами буде набагато нижче. Однак якщо ми поглянемо на абсолютні величини IQ, то легко помітити, що усиновлені діти як група набагато ближче до групи їх матерів-усиновлювачів. Дійсно, середні величини інтелекту в цих групах збігаються, тоді як в групі біологічних матерів вони набагато нижче. Оскільки усиновлені діти мають загальне середовище з матерями що їх усиновили і не мають такого з їх біологічними матерями, а за абсолютними величинами IQ виявляються набагато ближче до матерей-усиновлювачів, сам собою напрошується висновок про детермінацію інтелекту чинниками середовища. Разом з тим висока кореляція між біологічними родичами і відсутність такої у людей, не пов'язаних генетичною спорідненістю, свідчить про високий ступінь успадкування ознаки. У цьому прикладі міститься основний парадокс даних кількісної генетики: високий ступінь успадковування цілком може поєднуватися з чутливістю конкретних генотипів до змін середовища. Усиновлення в родини з більш сприятливим середовищем цілком може привести до того, що діти будуть випереджати своїх біологічних матерів за рівнем інтелекту. Разом з тим легко помітити, що хоча діти опинилися на іншому рівні шкали, вони зберегли свої рангові місця відповідно до свого біологічного походження. Таким чином, навіть якщо індивідуальні особливості дітей ідеально корелюють з особливостями їх біологічних батьків, ці діти як група в середньому можуть більше бути схожими на батьків-усиновлювачів.
У цьому прикладі дані генетики поведінки говорять про те, що варіативність інтелекту в популяції в основному обумовлена варіативністю генотипів, а не варіативністю середовищ. Це той висновок, який може зробити генетик. Але психолог, вимірявши середні величини інтелекту в групах дітей і їх батьків-усиновлювачів і біологічних батьків, має повне право сказати, що спостерігається схожість за інтелектом між усиновленими дітьми та їх батьками-усиновлювачами обумовлена загальним середовищем. Як не дивно, але висновки генетика і психолога абсолютно не суперечать один одному, але для генетика мірою схожості є кореляція, яка вказує на те, що показники інтелекту у родичів в популяції коваріюють, а для психолога основою для висновка є схожість в абсолютних значеннях або середніх величинах інтелекту в групах усиновлених дітей та їхніх матерів-усиновлювачів, яке говорить про можливість середовища впливати на фенотип в індивідуальному розвитку. Впливаючи на індивідуальний розвиток кожної конкретної дитини можна отримати збільшення схожості в абсолютних величинах ознаки між дітьми і батьками-усиновлювачами. Однак міжіндивідуальні відмінності за інтелектом, що спостерігаються в даному прикладі повинні бути пояснені генетичними відмінностями між індивідами. Підставою для цього і є висока кореляція між біологічними родичами.
Регресія
Коефіцієнт кореляції передбачає наявності будь-якої причинно-наслідкової залежності між змінними. Якщо зі збільшенням змінної х спостерігається зростання змінної y, то ми констатуємо наявність позитивної кореляції між цими змінними, однак на цій підставі ми ще не можемо стверджувати, що збільшення у є наслідком збільшення х. Наприклад, в містах ми можемо виявити, що кількість кафе і столових позитивно корелює з кількістю лікарень та поліклінік. Природно, з цього не випливає, що громадське харчування є причиною високої захворюваності населення, що і призводить до появи нових лікувальних установ. Просто кількість тих і інших закладів визначається чисельністю населення міста: чим більше жителів, тим більше необхідно як кафе, так і поліклінік. Звідси і висока позитивна кореляція. Таким чином, коефіцієнт кореляції дозволяє визначити лише наявність статистичного зв'язку між змінними, але не дозволяє встановити причину зв'язку. У статистиці існує й інший метод вимірювання зв'язку, який передбачає оцінку залежності однієї змінної від іншої. Це метод лінійної регресії. Метод регресії дозволяє передбачити, яку величину матиме залежна змінна у при будь-яких значеннях незалежної змінної х. Мова фактично йде про зрівняння регресії уi = a + b (xi - x), в якому нам необхідно визначити величини а та b відповідної лінії регресії. Незалежна змінна (xi - x) являє собою відхилення ознаки даного індивіда від середньо популяційної величини. Лінія регресії будується таким чином, щоб квадрати відстаней між нею і всіма точками на графіку були мінімальними. Коефіцієнт b називається коефіцієнтом регресії у на х. Якщо коефіцієнт регресії достовірно вище 0, то говорять про залежність змінної у від змінної х. В кількісній генетиці регресія застосовується в основному в дослідженнях батьків і дітей. Часто використовують одночасно і регресію, і кореляцію. Регресія має ряд переваг в порівнянні з кореляцією, застосування якої обмежено низкою умов. Регресія менш чутлива до цих умов.
Термін регресія був введений Ф. Гальтоном при дослідженні росту батьків і дітей. У цій роботі Ф. Гальтон зазначив, що у вищих батьків сини також відрізняються високим зростом, але все ж вони трохи нижчі за своїх батьків. У батьків невисокого зросту сини так само невисокі, але вони зазвичай вище своїх батьків. Таким чином, ріст дітей як би прагне до популяційної середньої. Це явище Ф. Гальтон назвав регресією на середню.
Умови відповідності коефіцієнта кореляції коефіцієнту спорідненості
Як вже зазначалось, виявлення ступеня внутрішньородинної схожості є основним методом кількісної генетики. Основоположники біометричної генетики, починаючи з Ф. Гальтона, ввели цей метод в ужиток генетичних досліджень, практично нічого не знаючи про механізми, що призводять до появи схожості між родичами. Зараз ми знаємо, що в основі фенотипової схожості лежить схожість генетична, обумовлена спільністю генів, отриманих від одного предка (якщо, звичайно, ознака не цілком обумовлена середовищем, а все ж залежить від дії генів). У 1918 р англійський генетик і статистик Р. Фішер показав, що результати, отримані основоположниками біометричної генетики, можуть бути пояснені саме з позицій менделевской генетики. Можна сказати, що в цьому році дві незалежні гілки генетики – менделевська і гальтонівська – нарешті знайшли шлях до об'єднання. Заслуга Р. Фішера в тому, що він показав, що очікувана ступінь схожості між родичами пояснюється полігенним спадкуванням, тобто детерминацією ознаки не одним, а багатьма генами, і при певних припущеннях вона відповідає коефіцієнтам спорідненості. В основі цього лежать імовірнісні процеси, що відбуваються при розщепленні і рекомбінації алелів, відкриті Г. Менделем. Виявилося, що регресія батьків до дитини або дитини до батьків, або сібса до сібса, або інших пар родичів відповідає частці загальних генів у цих родичів, тобто коефіцієнту спорідненості. Коефіцієнт кореляції дорівнює кореню квадратному з добутку двох регресій, тобто регресії першої величини по другій і другої величини по першій. Коефіцієнт кореляції буде еквівалентний регресії, коли дві регресії (наприклад, дитини до батьків і батьків до дитини) рівні. Таким чином, за певних умов коефіцієнт кореляції в парах родичів повинен відповідати частці загальних генів, або коефіцієнту спорідненості.
Які ж ці умови, або припущення, при яких реальна внутрішньородинна схожість буде відповідати теоретично розрахованій? Умови ці зводяться до наступного:
ü досліджувана ознака детермінована винятково генотипом, умови середовища ніяк не позначаються на фенотипі;
ü гени мають чисто адитивний ефект, відносини домінантності і рецесивності, ефекти епістазу не мають місця;
ü у чоловіка і дружини відсутня кореляція за досліджуваною ознакою, тобто шлюб є випадковим щодо досліджуваної ознаки. Інакше кажучи, не спостерігається асортативності за досліджуваною ознакою.
Отже, існує три умови, при точному дотриманні яких реально отримані кореляції між родичами повинні збігатися з теоретично розрахованими коефіцієнтами спорідненості. З усіх кількісних ознак людини найкраще задовольняють цим умовам дерматогліфічні візерунки на пальцях. Кожна людина має свій індивідуально специфічний характер дерматогліфічних борозен. Цей малюнок закладається на ранніх етапах ембріогенезу і згодом не зазнає ніяких змін, тобто не відчуває модифікацій під впливом середовища. Розподіл індивідів за кількістю борозен відповідає нормальному, гауссовому, отже, ми можемо припустити, що тут має місце чисто адитивне успадкування. Шлюби за такою ознакою, природно, не можуть бути вибірковими.
На відміну від кореляції, регресія менш чутлива до асортативності, тому регресією можна користуватися в родинних дослідженнях, коли передбачається вибірковість шлюбів за досліджуваною ознакою. Регресія дозволяє також виявляти так званий материнський ефект, тобто вплив фенотипу матерів на фенотип нащадків. При материнському ефекті регресія нащадків до матерів значно більша, ніж регресія до батьків. За регресією можна судити і про наявність ефектів домінування. Зазвичай для вивчення успадкування намагаються застосовувати різні методи: обчислення коефіцієнтів кореляції між різними групами родичів (батьки-нащадки, сібси, напівсібси, матері-доньки і т. ін.) і обчислення коефіцієнтів регресії тим чи іншим способом.