Всеки пети човешки ген не е „истински“

Ново изследване може да промени облика на биомедицината; установено е, че човешкият геном съдържа много по-малко „истински“ или кодиращи протеини гени, отколкото се смяташе преди.

Нашата ДНК може да съдържа много по-малко ‘реални’ гени, отколкото първоначално сме предполагали.

В началото на 90-те години учените се заеха да картографират цялата ДНК последователност на човешкия геном.

Така нареченият проект за човешки геном има за цел да намери генетични връзки със заболявания и да разбере функцията и структурата на различни елементи на генома, като например кои гени кодират протеини и какви фактори регулират генната експресия.

Първоначалните резултати от проекта за човешкия геном прогнозираха, че има 40 000 гена, които могат да кодират протеини, големи молекули, които са жизненоважни за доброто функциониране на тъканите и органите на тялото.

Въпреки това, когато този проект приключи през 2003 г., прогнозите за този брой спаднаха до около 20 000-25 000 гени, кодиращи протеини.

От този момент насам учените се стремят да излязат с окончателния протеом - т.е. общия брой протеини, които могат да бъдат експресирани от гени - и се фокусират върху разбирането как генетичната експресия на тези протеини е мутирала при няколко заболявания.

За тази цел международен екип от изследователи, ръководен от Майкъл Трес, от испанския Национален център за изследване на рака по биоинформатика в Мадрид, Испания, сега изследва гените, считани за кодиране на протеини от основните налични бази данни на протеомите.

Tress и колеги публикуваха резултатите от своите изследвания в списанието Изследване на нуклеинови киселини. Федерико Абаскал от института Wellcome Trust Sanger в Хинкстън, Великобритания, е първият автор на статията.

Поне 2000 гена са „псевдогени“

Изследователите сравняват протеомите от три колекции протеинови последователности и генетични анотации: GENCODE / Ensembl, RefSeq и UniProtKB.

Tress и екип установиха, че от общия брой на 22 210 гена, изброени като кодиращи протеини, само 19 446 са включени във всичките три колекции.

След това те увеличиха разликата от 2764 гена, изследвайки експерименталните доказателства и информацията, налична от анотациите.

Доказателствата сочат, че по-голямата част от тези гени са „некодиращи гени или псевдогени“.

Също така, учените установиха, че допълнителни 1470 гена - които са изброени като кодиращи протеини в трите колекции - нямат функционалните характеристики или типичната еволюция на гените, кодиращи протеини.

Следователно изследователите „вярват, че в момента трите референтни бази данни надценяват броя на човешките кодиращи гени с поне 2000, усложняващи и добавящи шум към мащабни биомедицински експерименти“.

„Определянето кои потенциални некодиращи гени не кодират протеини е трудна, но жизненоважна задача, тъй като човешкият референтен протеом е основен стълб на повечето основни изследвания и подкрепя почти всички мащабни биомедицински проекти.“

Указания за бъдещи изследвания

Трес споделя как изследователите продължават да излагат своите констатации. „Успяхме да анализираме много от тези гени в детайли“, обяснява той, „и повече от 300 гена вече са прекласифицирани като некодиращи.“

„Изненадващо“, излъчва съавторът на изследването Дейвид Хуан, „някои от тези необичайни гени са добре проучени и имат над 100 научни публикации, основани на предположението, че генът произвежда протеин.“

Следователно резултатите могат да променят областта на биомедицината, както я познаваме. Необходими са обаче повече изследвания.

„Нашите доказателства“, добавя Абаскал, „предполагат, че хората могат да имат само 19 000 кодиращи гена, но все още не знаем кои са [тези] 19 000 гена.“

!-- GDPR -->