ÎÃËßÄÈ ÓÄÊ 577.112.4. ÁÅËÊÎÂÛÉ ÑÏËÀÉÑÈÍà Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ Èíñòèòóò ìîëåêóëÿðíîé áèîëîãèè è ãåíåòèêè ÍÀÍ Óêðàèíû, Êèåâ; å-mail: [email protected] ²íòå¿íàìè º âíóòð³øí³ ïîë³ïåïòèäí³ ïîñë³äîâíîñò³, çäàòí³ ïîñòòðàíñëÿö³éíî àâòîêàòàë³òè÷íî âèäàëÿòèñÿ ç ìîëåêóëè á³ëêà-ïîïåðåäíèêà. Ó ñêëàä³ á³ëüøîñò³ ç íèõ âèä³ëÿþòü N- ³ Ñ-ê³íöåâ³ ñïëàéñèíãîâ³ äîìåíè òà öåíòðàëüíèé åíäîíóêëåàçíèé äîìåí. Îñòàíí³é çàáåçïå÷óº ìîá³ëüí³ñòü ³íòå¿íêîäóâàëüíî¿ ïîñë³äîâíîñò³ â ÄÍÊ – òàê çâàíèé õîóì³íã ³íòå¿í³â.  îãëÿä³ íàâåäåíî îñòàíí³ äàí³, îäåðæàí³ ïðè âèâ÷åíí³ áóäîâè òà ôóíêö³é ³íòå¿í³â. Çíà÷íó óâàãó òàêîæ ïðèä³ëåíî á³îòåõíîëîã³÷íèì ìåòîäàì, ùî áàçóþòüñÿ íà âèêîðèñòàíí³ á³ëêîâîãî ñïëàéñèíãó, çîêðåìà òàêèì ÿê ³íòå¿íîïîñåðåäêîâàíå î÷èùåííÿ ðåêîìá³íàíòíèõ á³ëê³â, çøèâàííÿ òà öèêë³çàö³ÿ ¿õ, ñòâîðåííÿ íîâèõ ôîðì á³îñåíñîð³â. Ê ë þ ÷ î â ³ ñ ë î â à: ³íòå¿í, á³ëêîâèé ñïëàéñèíã, õîóì³íã, î÷èùåííÿ á³ëê³â. íàñòîÿùåå âðåìÿ ìû ÿâëÿåìñÿ ñâèäåòåëÿìè òîãî, êàê êàðäèíàëüíî èçìåíÿþòñÿ îñíîâíûå âçãëÿäû íà ïðîöåññû, ïðîèñõîäÿùèå â ìèêðîìèðå. Íàïðèìåð, ðàíåå ñ÷èòàëîñü, ÷òî êàæäûé êëàññ ìàêðîìîëåêóë âûïîëíÿåò ñâîè, ñïåöèôè÷íûå äëÿ åãî êëàññà, ôóíêöèè. Òàê, ÄÍÊ ðàññìàòðèâàëàñü êàê íîñèòåëü íàñëåäñòâåííîé èíôîðìàöèè, à ÐÍÊ – êàê ïåðåíîñ÷èê åå è âàæíàÿ ñîñòàâíàÿ äåòàëü áåëîêñèíòåçèðóþùåé ìàøèíû. Äëÿ áåëêîâ æå áûëè îòâåäåíû ìíîãî÷èñëåííûå “èñïîëíèòåëüíûå” ôóíêöèè, â ÷àñòíîñòè êàòàëèç õèìè÷åñêèõ ðåàêöèé, êîíòðîëü ýêñïðåññèè ãåíîâ, ðåöåïòîðíûå, òðàíñïîðòíûå è äðóãèå ôóíêöèè. Îäíàêî íàêîïèâøèåñÿ ôàêòû ñâèäåòåëüñòâóþò î çíà÷èòåëüíî áîëüøåé ìíîãîôóíêöèîíàëüíîñòè êàæäîãî êëàññà ìàêðîìîëåêóë. Îêàçàëîñü, â ÷àñòíîñòè, ÷òî ÐÍÊ ìîæåò âûïîëíÿòü ðÿä ôóíêöèé, ðàíåå ñ÷èòàâøèõñÿ èñêëþ÷èòåëüíî áåëêîâûìè. Íà ïðîòÿæåíèè ìíîãèõ äåñÿòèëåòèé áèîõèìèêè áûëè óâåðåíû, ÷òî áèîëîãè÷åñêèé êàòàëèç âñåãäà è âñþäó îñóùåñòâëÿåòñÿ áåëêàìè-ôåðìåíòàìè. È âîò â 1982–1983 ãã. áûëî ïîêàçàíî, ÷òî â ïðèðîäå èìåþòñÿ òàêèå ÐÍÊ, êîòîðûå, ïîäîáíî áåëêàì, îáëàäàþò âûñîêîñïåöèôè÷åñêîé êàòàëèòè÷åñêîé àêòèâíîñòüþ. Òàêèå ÐÍÊ-êàòàëèçàòîðû áûëè íàçâàíû ðèáîçèìàìè. Ïðåäñòàâëåíèþ îá èñêëþ÷èòåëüíîñòè áåëêîâ â êàòàëèçå áèîõèìè÷åñêèõ ðåàêöèé ïðèøåë êîíåö. À â ïîñëåäíèå ãîäû ïîêàçàíî, ÷òî ðÿä íèçêîìîëåêóëÿðíûõ ÐÍÊ ñïîñîáíû ðåãóëèðîâàòü è äàæå áëîêèðîâàòü ýêñïðåññèþ ãåíîâ. Ïîñòåïåííî ãðàíü ìåæäó ôóíêöèÿìè, âûïîëíÿåìûìè ÐÍÊ è áåëêàìè, ñòàíîâèëàñü âñå áîëåå çûáêîé. Ôóíêöèîíàëüíûå ðàçëè÷èÿ ìåæäó íèìè îêàçàëèñü åùå áîëåå ýôå-  ìåðíûìè ïîñëå òîãî, êàê â 1990 ã. Ò. Ñòèâåíñîì ñ ñîòð. áûëî îáíàðóæåíî ÿâëåíèå áåëêîâîãî àâòîñïëàéñèíãà [1]. Êàê ýòî ÷àñòî áûâàåò, áåëêîâûé ñïëàéñèíã áûë îòêðûò ñëó÷àéíî, ïðè èññëåäîâàíèè ýêñïðåññèè äðîææåâîãî ãåíà VMA1, êîäèðóþùåãî ñóáúåäèíèöó vma1 âàêóîëÿðíîé ATÐ-àçû. Èññëåäîâàíèå ñòåïåíè ãîìîëîãèè äàííîãî ãåíà ó ðàçëè÷íûõ ìèêðîîðãàíèçìîâ íåîæèäàííî ïîêàçàëî, ÷òî ó äðóãèõ âèäîâ ãåí VMA1 êîäèðóåò áåëîê ñ ìîëåêóëÿðíîé ìàññîé îêîëî 70 êÄà, â òî âðåìÿ êàê äðîææåâîé ãåí êîäèðîâàë ïðîäóêò ñ áîëåå âûñîêîé ìîëåêóëÿðíîé ìàññîé – 119 êÄà. Ïðè ýòîì äëÿ êîíöåâûõ ïîñëåäîâàòåëüíîñòåé äðîææåâîãî ãåíà VMA1 õàðàêòåðíà âûñîêàÿ ñòåïåíü ãîìîëîãèè ñ àíàëîãè÷íûìè ïîñëåäîâàòåëüíîñòÿìè äðóãèõ ìèêðîîðãàíèçìîâ, òîãäà êàê â öåíòðàëüíîé ÷àñòè îíà íàðóøàåòñÿ. Îäíàêî ÷àñòè÷íàÿ äåëåöèÿ ýòîãî ãåíà ó äðîææåé ïðèâîäèò ê ïðåêðàùåíèþ ñèíòåçà ïîëèïåïòèäà ñ ìîëåêóëÿðíîé ìàññîé 69 êÄà, íî íå 119 êÄà. Áûëî âûäâèíóòî ïðåäïîëîæåíèå î òîì, ÷òî ÷àñòü àìèíîêèñëîòíîé ïîñëåäîâàòåëüíîñòè ïðåäøåñòâåííèêà ñ ìîëåêóëÿðíîé ìàññîé 119 êÄà îòùåïëÿåòñÿ íà óðîâíå ñèíòåçèðîâàííîãî ïîëèïåïòèäà. Äàëüíåéøèå èññëåäîâàíèÿ ïîëíîñòüþ ïîäòâåðäèëè ýòó ãèïîòåçó. Òàê, ñäâèã ðàìêè ñ÷èòûâàíèÿ â ñåãìåíòå ãåíà VMA1, êîäèðóþùåãî öåíòðàëüíóþ ÷àñòü ïîëèïåïòèäà è îòñóòñòâóþùóþ â çðåëîì áåëêå, ïðèâîäèò ê ïðåêðàùåíèþ ñèíòåçà áåëêà íà ðèáîñîìàõ èç-çà âîçíèêíîâåíèÿ â ìÐÍÊ íîâûõ òåðìèíèðóþùèõ êîäîíîâ òðàíñëÿöèè. Ïîäîáíîå íå ïðîèñõîäèëî á, åñëè áû öåíòðàëüíàÿ ÷àñòü ïðî-ìÐÍÊ ãåíà VMA1 óäàëÿëàñü âñëåäñòâèå 14 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ ñïëàéñèíãà. Êðîìå òîãî, àíàëèç êëåòî÷íûõ ëèçàòîâ ñ èñïîëüçîâàíèåì àíòèòåë ê öåíòðàëüíîé ÷àñòè ïîëèïåïòèäà, îòñóòñòâóþùåé â çðåëîé ñóáúåäèíèöå, ñâèäåòåëüñòâóåò î íàëè÷èè áåëêîâîãî ïðîäóêòà ñ ïðåäñêàçàííîé ìîëåêóëÿðíîé ìàññîé 50 êÄà. Îí ïðèñóòñòâóåò â êîëè÷åñòâåííîì ñîîòíîøåíèè 1 : 1 ê ôóíêöèîíàëüíî àêòèâíîìó ïîëèïåïòèäó ñ ìîëåêóëÿðíîé ìàññîé 69 êÄà. Ýòî óêàçûâàåò íà òî, ÷òî ïîñëåäîâàòåëüíîñòü ÐÍÊ â öåíòðàëüíîé ÷àñòè ãåíà òðàíñëèðóåòñÿ íà ðèáîñîìàõ, è ñîîòâåòñòâóþùàÿ ÷àñòü ïîëèïåïòèäà-ïðåäøåñòâåííèêà óäàëÿåòñÿ óæå ïîñòòðàíñëÿöèîííî [1]. Ýòè, à òàêæå äðóãèå ðåçóëüòàòû, ïîçâîëÿþò óòâåðæäàòü, ÷òî ïîìèìî àëüòåðíàòèâíîãî ñïëàéñèíãà ÄÍÊ è ñïëàéñèíãà ìÐÍÊ ñóùåñòâóåò òðåòèé âàðèàíò åãî – áåëêîâûé, ïðè êîòîðîì öåíòðàëüíàÿ ÷àñòü àìèíîêèñëîòíîé ïîñëåäîâàòåëüíîñòè óäàëÿåòñÿ, à ôëàíêèðóþùèå ïîñëåäîâàòåëüíîñòè ëèãèðóþòñÿ. Ïðîöåññ ÿâëÿåòñÿ àâòîêàòàëèòè÷åñêèì è íå òðåáóåò ïðèñóòñòâèÿ êàêèõ-ëèáî êîôàêòîðîâ èëè ôåðìåíòîâ. Ýòî îòëè÷àåò áåëêîâûé ñïëàéñèíã îò ïîñòòðàíñëÿöèîííîãî ïðîöåññèíãà. Îïðåäåëåíèÿ è òåðìèíû.  1994 ã. áûë ïðåäëîæåí ðÿä òåðìèíîâ, ðåêîìåíäóåìûõ äëÿ îïèñàíèÿ ïðîöåññîâ áåëêîâîãî ñïëàéñèíãà [2]. – Áåëêîâûé ñïëàéñèíã, èëè àâòîñïëàéñèíã áåëêà – àâòîêàòàëèòè÷åñêèé ïðîöåññ óäàëåíèÿ öåíòðàëüíîé îáëàñòè ïîëèïåïòèäà ñ ïîñëåäóþùèì ëèãèðîâàíèåì ôëàíêèðóþùèõ ïîñëåäîâàòåëüíîñòåé; – Èíòåèí – âíóòðåííÿÿ ÷àñòü ïîëèïåïòèäà, óäàëÿåìàÿ â ïðîöåññå áåëêîâîãî ñïëàéñèíãà; – Áåëîê-ïðåäøåñòâåííèê – áåëîê, ñîäåðæàùèé èíòåèí; – Ñàéò ñïëàéñèíãà – òî÷êà, â êîòîðîé ïðîèñõîäèò ðàñùåïëåíèå ïåïòèäíîé ñâÿçè; – N-ýêñòåèí è Ñ-ýêñòåèí – âíåøíèå N- è C-êîíöåâûå ÷àñòè ïîëèïåïòèäà, ôëàíêèðóþùèå èíòåèí; – Çðåëûé áåëîê (ñèíîíèìû – ñëèòûé áåëîê, ëèãèðîâàííûé áåëîê, ñïëàéñèðîâàííûé áåëîê) – ëèãèðîâàííûé N- è Ñ-ýêñòåèí; – N-êîíöåâîé ñïëàéñèíã, èëè N-ñïëàéñèíã – ðàçðûâ, êîòîðûé ïðîèñõîäèò ìåæäó Ñ-êîíöîì N-ýêñòåèíà è N-êîíöîì èíòåèíà; – Ñ-êîíöåâîé ñïëàéñèíã èëè Ñ-ñïëàéñèíã – ðàçðûâ, êîòîðûé ïðîèñõîäèò ìåæäó Ñ-êîíöîì èíòåèíà è N-êîíöîì Ñ-ýêñòåèíà; – N-ñïëàéñèíãîâûé äîìåí – N-êîíöåâîé äîìåí èíòåèíà; – Ñ-ñïëàéñèíãîâûé äîìåí – Ñ-êîíöåâîé äîìåí èíòåèíà. Ðàçëè÷íûå èíòåèíû ïîëó÷èëè íàçâàíèÿ, èñõîäÿ èç ñîêðàùåííîãî íàçâàíèÿ âèäà, ó êîòîðîãî îáíàðóæåí äàííûé áåëîê-ïðåäøåñòâåííèê, è íàçâàíèÿ ãåíà, êîäèðóþùåãî èíòåèíñîäåðæàùèé áåëîê. Íàïðèìåð, èíòåèí âàêóîëÿðíîé ÀÒÐ-àçû (vma) äðîææåé (Saccharomyces cerevisiae) ïîëó÷èë íàçâàíèå Sce VMA. Eñëè èíòåèí îáëàäàåò ýíäîíóêëåàçíîé àêòèâíîñòüþ, òî åãî îáîçíà÷àþò ïî àíàëîãèè ñ ýíäîíóêëåàçàìè, êîäèðóåìûìè èíòðîíàìè 1-ãî òèïà: íàïðèìåð PI-PfuI è PI-PfuII – èíòåèíû ¹ 1 è 2 ðèáîíóêëåîòèäðåäóêòàçû Pyrococcus furiosus, ãäå PI îáîçíà÷àåò Protein Insert, à I è II – ïîðÿäêîâûé íîìåð èíòåèíà (ïðè óñëîâèè, ÷òî èõ íåñêîëüêî). Îáùàÿ ñõåìà îðãàíèçàöèè èíòåèíà. Äëèíà âñåõ èçâåñòíûõ íà ñåãîäíÿ èíòåèíîâ ñîñòàâëÿåò 134–600 àìèíîêèñëîòíûõ îñòàòêîâ (à. î.) [3]. Àíàëèç èõ ñòðóêòóðû ïîêàçàë, ÷òî ìîæíî âûäåëèòü ðÿä êîíñåðâàòèâíûõ ìîòèâîâ, õàðàêòåðíûõ äëÿ áîëüøèíñòâà èíòåèíîâ [4–7].  íàñòîÿùåå âðåìÿ îáíàðóæåíî íåñêîëüêî òèïîâ èõ. Ýòî êëàññè÷åñêèå èíòåèíû è ìèíè-èíòåèíû, êîòîðûå îòëè÷àþòñÿ íàëè÷èåì èëè îòñóòñòâèåì öåíòðàëüíîãî ýíäîíóêëåàçíîãî äîìåíà (ðèñ. 1). Îäíàêî N- è Ñ-êîíöû ó îáîèõ òèïîâ èíòåèíîâ õàðàêòåðèçóþòñÿ âûñîêîé ãîìîëîãèåé.  óñðåäíåííîì èíòåèíå ìîæíî âûäåëèòü 10 ïîñëåäîâàòåëüíûõ êîíñåðâàòèâíûõ àìèíîêèñëîòíûõ ìîòèâîâ, îáîçíà÷åííûõ ëàòèíñêèìè áóêâàìè A, N2, B, N4, C, D, E, Í, F, G [5,7]. Îáîáùåííûå ôîðìóëû ìîòèâîâ ïðåäñòàâëåíû â òàáë. 1. Ìîòèâû À, N2, B, N4, F è G îáåñïå÷èâàþò àâòîñïëàéñèíã èíòåèíà, ìîòèâû C, D, E è Í – åãî ýíäîíóêëåàçíóþ àêòèâíîñòü. Ðàññìîòðèì îñíîâíûå õàðàêòåðèñòèêè êàæäîãî ìîòèâà. A-ìîòèâ. Ýòî êîðîòêèé ìîòèâ íà N-êîíöå èíòåèíà, êîòîðûé ñîñòîèò èç 13 à.î., äâà èç êîòîðûõ (ïåðâûé è ïîñëåäíèé) ÿâëÿþòñÿ âûñîêîêîíñåðâàòèâíûìè. Ïðàêòè÷åñêè âñåãäà íà N-êîíöå èíòåèíà (ïîëîæåíèå 1) ðàñïîëîæåí Cys. Î÷åíü ðåäêî â ýòîì ïîëîæåíèè îáíàðóæèâàþò Ala, Gln èëè Ser.  ïîëîæåíèè 13, êðîìå Gly, èíîãäà íàõîäÿòñÿ Ala, Lys, Thr, Arg, Tyr, Asn. Âûñîêàÿ êîíñåðâàòèâíîñòü àìèíîêèñëîò íà N-êîíöå â À-ìîòèâå îáúÿñíÿåòñÿ èõ êðèòè÷íîñòüþ äëÿ èíèöèàöèè ñïëàéñèíãà. Ìîòèâ N2 ñîñòîèò èç 7 à.î., èç êîòîðûõ îäèí – Asp èëè Glu â ïîëîæåíèè 5 – ÿâëÿåòñÿ êîíñåðâàòèâíûì. ×àùå âñåãî ýòîìó îñòàòêó ïðåäøåñòâóåò îñòàòîê Gly. B-ìîòèâ, îòäåëåííûé îò ìîòèâà À ëèíêåðîì, èìåþùèì äëèíó â 50–60 à.î., ñîñòîèò èç 14 à.î., ñðåäè êîòîðûõ His â ïîëîæåíèè 10 ïðèñóòñòâóåò â äàííîé ïîçèöèè âî âñåõ èçâåñòíûõ íà ñåãîäíÿ èíòåèíàõ. ×àùå âñåãî ðÿäîì ñ íèì, â ïîëîæåíèè 7, íàõîäèòñÿ àìèíîêèñëîòà Thr, îäíàêî äëÿ íåå íå õàðàêòåðíà 100%-íàÿ êîíñåðâàòèâíîñòü [5]. Â-ìîòèâ ôîðìèðóåò àêòèâíûé öåíòð, îáëåã÷àþùèé ðàçðûâ ïåïòèäíîé ñâÿçè íà N-êîíöå èíòåèíà [8]. ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 15 ÎÃËßÄÈ A Домены N-сплайсинговый Интеиновые мотивы A N-экстеин Консервативные аминокислотные остатки N2 B DOD-эндонуклеазный N4 C D С-сплайсинговый E Н F G С-экстеин C S A HN C HQ S Т Н T Интеин (450–600 а.о.) Б А Домены Интеиновые мотивы Интеновые мотивы N-экстеин Консервативные аминокислотные остатки N-сплайсинговый A N2 B Линкер С-сплайсинговый N4 F G С-экстеин C S A HN C HQ S Т Н T Интеин (134–300 а.о.) Б Ðèñ. 1. Ñõåìà ñòðîåíèÿ îñíîâíûõ òèïîâ èíòåèíîâ [8]: À – êëàññè÷åñêèé DOD-ñîäåðæàùèé èíòåèí, Á – ìèíè-èíòåèí. Ò à á ë è ö à 1. Îáîáùåííàÿ ôîðìóëà àìèíîêèñëîòíûõ ïîñëåäîâàòåëüíîñòåé â ðàçëè÷íûõ èíòåèíîâûõ ìîòèâàõ Мотив Аминокислотная Обозначения последовательность A Ch..Dp.hhh..G Ν2 …GD.. B G..h.hT..H.hhh h - гидрофобные остатки (G,V,L,I,A,M) Ν4 ………GD….. а – кислые остатки (D,E) С LhG..hhaG r – ароматические остатки (F,Y,W) D .K.IP..h р – полярные остатки (S,T,C) Е .L.GhFahDG . – неконсервативный остаток +1 Н p.S..hh..h..LL..hGI p - +1 остаток С-экстеина (S,T,C) F rVYDLpV..a..HNFh – место разрыва на С-конце интеина G NGhhhHN p +1 Ìîòèâ N4 ñîñòîèò èç 16 à.î., èç êîòîðûõ îäèí – Asp èëè Glu – â ïîëîæåíèè 11 ÿâëÿåòñÿ êîíñåðâàòèâíûì. Òàê æå, êàê è ó N2-ìîòèâà, ÷àñòî â ïîëîæåíèè 10 íàõîäèòñÿ îñòàòîê Gly. Îäíàêî â îòëè÷èå îò N2-ìîòèâà, N4-ìîòèâ îáíàðóæåí íå ó âñåõ èíòåèíîâ (îòñóòñòâóåò ó SceVMA, CtrVMA, CeuClpP è äð.) [7]. Ìîòèâû À, N2, N4 è  ôîðìèðóþò N-êîí- 16 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ öåâîé ñïëàéñèíãîâûé äîìåí. Îáùàÿ äëèíà åãî ñîñòàâëÿåò îêîëî 150–200 à.î. [7]. Ìíîãèå èç óêàçàííûõ êîíñåðâàòèâíûõ àìèíîêèñëîò ÿâëÿþòñÿ àáñîëþòíî íåîáõîäèìûìè äëÿ ñïëàéñèíãà: àìèíîêèñëîòíûå çàìåíû â óêàçàííûõ âûøå ïîçèöèÿõ ÷àñòî ïîëíîñòüþ áëîêèðóþò èíèöèàöèþ ñïëàéñèíãà èíòåèíà. C-ìîòèâ è E-ìîòèâ ÿâëÿþòñÿ DOD-ýëåìåíòàìè (dod1 è dod2 ñîîòâåòñòâåííî). Èõ ñòðîåíèå àíàëîãè÷íî èçâåñòíûì DOD-ýíäîíóêëåàçàì: ïîñëåäîâàòåëüíîñòè, ñîäåðæàùèå 9 è 10 à.î., ôîðìèðóþò öåíòðû óçíàâàíèÿ äâóõöåïî÷å÷íîé ÄÍÊ è ðàçäåëåíû ëèíêåðîì, ñîñòîÿùèì èç 90–130 à.î.  àêòèâíîì öåíòðå âûäåëÿþò êîíñåðâàòèâíûå îñòàòêè Gly (ïîçèöèè 3, 9 è 4, 10 ìîòèâîâ Ñ è Å ñîîòâåòñòâåííî). Ïðè ýòîì êàæäûé ìîòèâ ñîäåðæèò êàòàëèòè÷åñêè àêòèâíûå Asn è Lis. D-ìîòèâ (8 à. î.) ÿâëÿåòñÿ ëèíêåðîì, êîòîðûé òàêæå ìîæåò âëèÿòü íà ýíäîíóêëåàçíóþ àêòèâíîñòü ñîñåäíèõ ìîòèâîâ (ïîêàçàíî, ÷òî çàìåíà Lis â ïîëîæåíèè 2 ìîæåò áëîêèðîâàòü ýíäîíóêëåàçíóþ àêòèâíîñòü DOD-äîìåíà [5]). Í-ìîòèâ ñîäåðæèò 19 à. î., èç êîòîðûõ äîâîëüíî ÷àñòî ïîâòîðÿåòñÿ ïîñëåäîâàòåëüíîñòü Leu-Leu â ïîëîæåíèè 13–14. Ìîòèâû Ñ, D, E, H ôîðìèðóþò DOD-ýíäîíóêëåàçíûé äîìåí, êîòîðûé ïðèñóòñòâóåò â êëàññè÷åñêèõ èíòåèíàõ. Îñíîâíàÿ ðîëü ýòîãî äîìåíà – èíäóêöèÿ ìîáèëüíîñòè èíòåèíîâûõ ãåíîâ. Öåëåñîîáðàçíî åùå ðàç ïîä÷åðêíóòü ñëåäóþùåå: âñå ýêñïåðèìåíòàëüíûå äàííûå ñâèäåòåëüñòâóþò, ÷òî íàëè÷èå DOD-äîìåíà íå ÿâëÿåòñÿ íåîáõîäèìûì äëÿ îñóùåñòâëåíèÿ áåëêîâîãî ñïëàéñèíãà [4,5,7,9]. Ïîäòâåðæäåíèåì ýòîãî ÿâëÿþòñÿ ìèíè-èíòåèíû, êîòîðûå ëèøåíû åãî, îäíàêî ýôôåêòèâíî ñàìîóäàëÿþòñÿ in vivo è in vitro. Òàêæå èçó÷åíî íåñêîëüêî èíòåèíîâ (Ssp GyrB, Ter GyrB), ÿâëÿþùèõñÿ HNH-ýíäîíóêëåàçàìè ñî ñïåöèôè÷íûì ñòðîåíèåì ýíäîíóêëåàçíîãî äîìåíà, îòëè÷íîãî îò DOD-äîìåíà. Êðîìå òîãî, ìíîãèå èíòåèíû íåñóò óêîðî÷åííûé íàáîð ìîòèâîâ â ýíäîíóêëåàçíîì äîìåíå – C,D,H (CeuClpP); C,E,H (CivRIR1, MchRecA, MfaRecA); D,E,H (MjaHyp-1, MjaRpolA) èëè òîëüêî Í-ìîòèâ (NpuGyrB, SspGyrB, TerGyrB) è äð. [5]. Ìîòèâû F è G ôîðìèðóþò Ñ-êîíöåâîé àâòîêàòàëè÷åñêèé äîìåí, îáùàÿ äëèíà êîòîðîãî ñîñòàâëÿåò îêîëî 25–40 à.î. [7]. Õàðàêòåðíî, ÷òî Fè G-ìîòèâû ðàçäåëåíû î÷åíü íåáîëüøèì ëèíêåðîì, îáû÷íî îò 2 äî 5 à.î. F-ìîòèâ ñîñòîèò èç 16 à.î., èç êîòîðûõ ïîëîâèíà ÿâëÿåòñÿ âûñîêîêîíñåðâàòèâíûìè (òàáë. 1). G-ìîòèâ ïðåäñòàâëÿåò ñîáîé êîðîòêóþ Ñ-êîíöåâóþ ïîñëåäîâàòåëüíîñòü, ñîñòîÿùóþ èç 8 à.î. – 7 àìèíîêèñëîò èíòåèíà è N-êîíöåâîé àìèíîêèñëîòû Ñ-ýêñòåèíà.  èíòåèíå ïîñëåäíåé àìèíîêèñëîòîé ïðàêòè÷åñêè âñåãäà ÿâëÿåòñÿ Asn (î÷åíü ðåäêî Gln), à ïðåäïîñëåäíåé – His. Ýòè äâå àìèíîêèñëîòû àáñîëþòíî êðèòè÷íû äëÿ òåðìèíàöèè ñïëàéñèíãà in vivo [5,7], êàê è N-êîíöåâàÿ àìèíîêèñëîòà Ñ-ýêñòåèíà (+1 àìèíîêèñëîòà).  ïîëîæåíèè +1 ó âñåõ èçâåñòíûõ Ñ-ýêñòåèíîâ íàõîäèòñÿ îäíà èç òðåõ àìèíîêèñëîò – Ser, Thr èëè Cys. Çàìåíà êîíñåðâàòèâíûõ àìèíîêèñëîò, â ÷àñòíîñòè ïîñëåäîâàòåëüíîñòè HisAsn(Gln) è +1 àìèíîêèñëîòû ýêñòåèíà, áëîêèðóåò òåðìèíàöèþ ñïëàéñèíãà èíòåèíà in vivo, ÷òî ïðèâîäèò ê íàêîïëåíèþ òàê íàçûâàåìûõ ðàçâåòâëåííûõ èíòåðìåäèàòîâ (äàííûå ïðèâîäÿòñÿ íèæå) [3,8]. Ýòîò ïîäõîä áûë èñïîëüçîâàí ïðè èññëåäîâàíèè ìåõàíèçìà ñïëàéñèíãà [3]. Ìåõàíèçìû áåëêîâîãî ñïëàéñèíãà. Ìíîãèìè èññëåäîâàòåëÿìè áûëî ïîêàçàíî, ÷òî áåëêîâûé ñïëàéñèíã ÿâëÿåòñÿ àóòîêàòàëèòè÷åñêèì ïðîöåññîì è äëÿ ñâîåãî îñóùåñòâëåíèÿ, êðîìå ïîëèïåïòèäà-ïðåäøåñòâåííèêà, íå òðåáóåò ïðèñóòñòâèÿ äðóãèõ êîôàêòîðîâ [2,3,5,10]. Îäíàêî îïðåäåëèòü òî÷íûé ìåõàíèçì, ïî êîòîðîìó îñóùåñòâëÿåòñÿ ñïëàéñèíã áåëêîâ, äîëãîå âðåìÿ íå óäàâàëîñü. Àâòîñïëàéñèíã ïðîòåêàåò íàñòîëüêî áûñòðî, ÷òî îáû÷íûìè ìåòîäàìè îáíàðóæèòü ïðîìåæóòî÷íûå ñîåäèíåíèÿ íå óäàâàëîñü. Ðåøèòü ýòó çàäà÷ó óäàëîñü ãðóïïå Ô. Ïåðëåð. Ïðîèçâîäÿ çàìåíû ðÿäà êðèòè÷íûõ àìèíîêèñëîò â Ñ-êîíöåâîì äîìåíå èíòåèíîâ, îíè ñìîãëè äîáèòüñÿ íàêîïëåíèÿ óñòîé÷èâûõ ïðîìåæóòî÷íûõ ñîåäèíåíèé – ðàçâåòâëåííûõ èíòåðìåäèàòîâ [3]. Èññëåäîâàíèå ïîñëåäíèõ ïîçâîëèëî îïðåäåëèòü òî÷íûå ìåõàíèçìû, ïî êîòîðûì ïðîòåêàåò áåëêîâûé ñïëàéñèíã. Ñîãëàñíî ïðèíÿòîé íà ñåãîäíÿ ìîäåëè, áåëêîâûé ñïëàéñèíã ñîñòîèò èç ñåðèè ñîãëàñîâàííûõ íóêëåîôèëüíûõ ïåðåñòàíîâîê [8]. Ïðîöåññîì, çàïóñêàþùèì åãî, ÿâëÿåòñÿ ñïîíòàííûé N-O-ñäâèã (åñëè ïåðâàÿ àìèíîêèñëîòà íà N-êîíöå èíòåèíà – Ser) èëè N-S-ñäâèã (åñëè ïåðâàÿ àìèíîêèñëîòà – Cys) íà N-êîíöåâîì ñàéòå ñïëàéñèíãà (ðèñ. 2, À). Íà âòîðîì ýòàïå ïðîèñõîäèò íóêëåîôèëüíàÿ àòàêà îáðàçîâàâøåéñÿ ýôèðíîé ñâÿçè OH- èëè SH-ãðóïïîé +1 àìèíîêèñëîòû C-ýêñòåèíà ñ ïîñëåäóþùåé òðàíñýòåðèôèêàöèåé (ðèñ. 2 è 3). Åñëè íà N-êîíöå èíòåèíà íàõîäèòñÿ Ala, òî èíèöèàöèÿ ñïëàéñèíãà ïðîèñõîäèò ïî àëüòåðíàòèâíîìó ìåõàíèçìó: OH-ãðóïïà êîíñåðâàòèâíîãî îñòàòêà Ser, ðàñïîëîæåííîãî â ïîëîæåíèè +1 C-ýêñòåèíà, íóêëåîôèëüíî àòàêóåò êàðáîíèëüíóþ ãðóïïó ïåïòèäíîé ñâÿçè, ðàñïîëîæåííîé â N-êîíöå èíòåèíà. Âñëåäñòâèå êàê ñòàíäàðòíîãî, òàê è àëüòåðíàòèâíîãî N-ñïëàéñèíãà, îáðàçóåòñÿ ðàçâåòâëåííîå ïðîìåæóòî÷íîå ñîåäèíåíèå. Íóêëåîôèëüíàÿ ïåðåñòàíîâêà ïðèâîäèò ê ñìåùåíèþ çàðÿäîâ, ÷òî, â ñâîþ î÷åðåäü, âûçûâàåò íà Ñ-êîíöå èíòåèíà ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 17 ÎÃËßÄÈ A Б Ser1 Ser +1 Cys СУУ Ν-экстеин Интеин N-O сдвиг С-экстеин Hh-N Asn Трансэтерефикация Трансэтерификация Hh-C N-S сдвиг Связывание холестерола Холестерин Трансэтерификация Трансэтерефикация (холестероловая атака) Циклизация Asn Hh-N-холестерол Свободный Hh-C O-N сдвиг А Лигированные экстеины Б Ðèñ. 2. À – ñõåìà êëàññè÷åñêîãî áåëêîâîãî ñïëàéñèíãà, Á – ñõåìà èíòåèíïîäîáíîãî ñîçðåâàíèÿ áåëêîâ cåìåéñòâà Hh [5], ÑÓÓ – ñòåðèíóçíàþùèé ó÷àñòîê. öèêëèçàöèþ áîêîâîé ãðóïïû Asn ñ îáðàçîâàíèåì ñóêöèíèìèäà. Ýòî ïðèâîäèò ê ðàçðûâó ïåïòèäíîé ñâÿçè ìåæäó èíòåèíîì è Ñ-ýêñòåèíîì – ðàçâåòâëåííàÿ ñòðóêòóðà ðàñïàäàåòñÿ íà ñâîáîäíûé èíòåèí è ëèãèðîâàííûå ýêñòåèíû, ñâÿçàííûå äðóã ñ äðóãîì ñëîæíîýôèðíîé ñâÿçüþ (ðèñ. 2, À), êîòîðàÿ ñïîíòàííî ïðåîáðàçóåòñÿ â ýíåðãåòè÷åñêè áîëåå âûãîäíóþ ïåïòèäíóþ ñâÿçü ïîñëå N-O- (ïðè Ser+1) èëè N-S-ñäâèãà (ïðè Cys+1).  íàñòîÿùåå âðåìÿ âûäåëÿþò äâà âèäà ñïëàéñèíãà: ñòàíäàðòíûé ïóòü, îïèñàííûé âûøå, à òàêæå èíòåèíïîäîáíûé ïðîöåññèíã ýìáðèîíàëüíûõ ñèãíàëüíûõ áåëêîâ ñåìåéñòâà Hh (Hedgehog Protein). Ñèãíàëüíàÿ ñèñòåìà Hh îáíàðóæåíà ó ÷åëîâåêà, ìûøè, êóðèöû, ëÿãóøêè, ðûáû, ìîðñêîãî åæà, ïèÿâêè, íàñåêîìûõ è â äðóãèõ îðãàíèçìàõ. Âî ìíîãèõ ðàáîòàõ ïîêàçàíî èñêëþ÷èòåëüíî âàæíîå âëèÿíèå áåëêîâ ñåìåéñòâà Hh íà ïðîöåññû ôîðìèðîâàíèÿ ýìáðèîíà [3,11,12].  àñïåêòå æå äàííîãî îáçîðà íàñ èíòåðåñóåò ïðîöåññ äîçðåâàíèÿ ýòèõ áåëêîâ, êîòîðûå ýêñïðåññèðóþòñÿ â âèäå íåàêòèâíûõ ïðåäøåñòâåííèêîâ, ñîñòîÿùèõ èç äâóõ äîìåíîâ: ñèãíàëüíîãî N-òåðìèíàëüíîãî äîìåíà (Hh-N) è êàòàëèòè÷åñêîãî Ñ-äîìåíà (Íh-C).  ñîñòàâå Íh-C îáíàðóæåíû êîíñåðâàòèâíûå ìîòèâû, àíàëîãè÷íûå ìîòèâàì À è  èíòåèíîâ. Ïåðâîé àìèíîêèñëîòîé Íh-C ÿâëÿåòñÿ Cys, êîòîðûé àêòèâèðóåòñÿ âñëåäñòâèå ñïîíòàííîé ïåðåñòàíîâêè, àíàëîãè÷íîé ïåðâîìó øàãó ñòàíäàðòíîãî ìåõàíèçìà áåëêîâîãî ñïëàéñèíãà (ðèñ. 2, Á). Ñëåäóþùèì ïðîöåññîì ÿâëÿåòñÿ ñâÿçûâàíèå ñòåðèíóçíàþùèì ó÷àñòêîì íà Ñ-êîíöå Íh-C ìîëåêóëû õîëåñòåðîëà. Ãèäðîêñèëüíàÿ ãðóïïà ïîñëåäíåãî íóêëåîôèëüíî àòàêóåò êàðáîíèëüíóþ ãðóïïó ïåïòèäíîé ñâÿçè íà Ñ-êîíöå ñèãíàëüíî- 18 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ Ile 156 HO С-конец интеина NH Ser -2 O O NH N O H Gly -1 O О O S H Cys 1 HN Ser 155 Asn 154 HO Thr 138 H2N N-конец интеина O Ðèñ. 3. Ñõåìà íóêëåîôèëüíîé àòàêè N-êîíöà èíòåèíà áîêîâûì ðàäèêàëîì +1 àìèíîêèñëîòû [8]. Ñòðåëêàìè ïîêàçàíî ñìåùåíèå ýëåêòðîííîé ïëîòíîñòè: Ser-2, Gly-1 – Ñ-êîíöåâûå àìèíîêèñëîòû N-ýêñòåèíà; Cys 1 – ïåðâàÿ àìèíîêèñëîòà èíòåèíà; Thr 138 – àìèíîêèñëîòà â ñåðåäèíå ìîëåêóëû èíòåèíà; Asn 154 – Ñ-êîíöåâàÿ àìèíîêèñëîòà èíòåèíà; Ser 155, Ile 156 – N-êîíöåâûå àìèíîêèñëîòû Ñ-ýêñòåèíà. Òî÷êîé îòñ÷åòà ïîðÿäêîâûõ íîìåðîâ àìèíîêèñëîò ÿâëÿåòñÿ N-àìèíîêèñëîòà èíòåèíà (Cys 1). ãî äîìåíà Hh-N, ÷òî âûçûâàåò ðàçðûâ ïåïòèäíîé ñâÿçè ìåæäó Hh-N- è Hh-Ñ-äîìåíàìè è êîâàëåíòíóþ ïðèøèâêó ýòîãî ñïèðòà ê Hh-N. Ìîäèôèêàöèÿ õîëåñòåðîëîì ñèãíàëüíîãî Hh-N-äîìåíà îáåñïå÷èâàåò åãî ìèãðàöèþ è âñòðàèâàíèå â ïëàçìàòè÷åñêóþ ìåìáðàíó èëè âûõîä áåëêà èç êëåòêè, ÷òî ïîçâîëÿåò åìó âûïîëíÿòü ñâîè ôóíêöèè [11,12]. Âûøåîïèñàííûå ïðîöåññû ÿâëÿþòñÿ ïðèìåðàìè áåëêîâîãî öèñ-ñïëàéñèíãà, ò.å. àâòîêàòàëèòè÷åñêîãî óäàëåíèÿ èíòåèíà èç áåëêà-ïðåäøåñòâåííèêà. Êðîìå òîãî, ó ìíîãèõ îðãàíèçìîâ îáíàðóæåíî ÿâëåíèå òðàíñ-ñïëàéñèíãà áåëêîâ [13], âñëåäñòâèå êîòîðîãî ïðîèñõîäèò ëèãèðîâàíèå äâóõ áåëêîâ, êîäèðóåìûõ äâóìÿ ðàçëè÷íûìè ãåíàìè. Ýòîò ïðîöåññ îïîñðåäóåòñÿ èíòåèíïîäîáíûìè äîìåíàìè (ÈÏÄ), êîòîðûå íàõîäÿòñÿ íà îïðåäåëåííîì êîíöå êàæäîãî áåëêà. Îíè õàðàêòåðèçóþòñÿ âûñîêèì ñðîäñòâîì äðóã ê äðóãó è ïðè íåêîâàëåíòíîì ñâÿçûâàíèè îáðàçóþò ïîëíîöåííûé èíòåèí (ðèñ. 4). Äàëåå ñïëàéñèíã îñóùåñòâëÿåòñÿ ïî îïèñàííîìó âûøå ñòàíäàðòíîìó ìåõàíèçìó.  ðåçóëüòàòå ïîëèïåïòèäíûå öåïè, ïðèëåãàþùèå ê èíòåèíïîäîáíûì äîìåíàì, ëèãèðóþòñÿ. Ïî òàêîé ñõåìå, íàïðèìåð, ôîðìèðóåòñÿ áåëîê dnaE, ñëèÿíèå ÷àñòåé êîòîðîãî îïîñðåäóåòñÿ àññîöèàöèåé N-ÈÏÄ (123 à.î.) ñ Ñ-ÈÏÄ (32 à.î.) [13]. Ýíäîíóêëåàçíàÿ àêòèâíîñòü èíòåèíîâ. Ãåíå- òè÷åñêàÿ ìîáèëüíîñòü ÄÍÊ-ïîñëåäîâàòåëüíîñòåé, êîäèðóþùèõ èíòåèíû, áûëî îäíîé èç ñàìûõ áîëüøèõ íåîæèäàííîñòåé, îáíàðóæåííûõ ïîñëå îòêðûòèÿ ýòèõ ïîëèïåïòèäîâ [4,14]. Îêàçàëîñü, ÷òî ìíîãèì èíòåèíàì ñâîéñòâåííà ýíäîíóêëåàçíàÿ àêòèâíîñòü, îáåñïå÷èâàþùàÿ íàïðàâëåííûé ïåðåíîñ ïîñëåäîâàòåëüíîñòè, êîäèðóþùåé èíòåèí, èç ãåíà, åå ñîäåðæàùåãî (àëëåëü(+)), â àëëåëüíûé ãåí, íå ñîäåðæàùèé åå (àëëåëü(-)) [3,14]. Ýòîò ôåíîìåí íàçûâàåòñÿ õîóìèíãîì èíòåèíîâ, ïî àíàëîãèè ñ õîóìèíãîì èíòðîíîâ ìÐÍÊ I ãðóïïû [15]. Õîóìèíã-ýíäîíóêëåàçû – ýòî áîëüøîé êëàññ ñàéò-ñïåöèôè÷íûõ ÄÍÊ-àç. Îíè êîäèðóþòñÿ ìîáèëüíûìè ãåíåòè÷åñêèìè ýëåìåíòàìè, òàêèìè êàê èíòðîíû ãðóïïû I èëè èíòåèíû. Âñå õîóìèíã-ýíäîíóêëåàçû ïðèíàäëåæàò ê ÷åòûðåì ñåìåéñòâàì â ñîîòâåòñòâèè ñî ñòðîåíèåì èõ àêòèâíîãî öåíòðà: LAGLIDADG (èëè DOD), GIY-YIG, His-Cys è H-N-H [14]. Íàçâàíèÿ ñåìåéñòâ îòðàæàþò êîíñåðâàòèâíûå àìèíîêèñëîòíûå ìîòèâû àêòèâíûõ öåíòðîâ ýíäîíóêëåàç. Íàïðèìåð, äëÿ DOD-ýíäîíóêëåàç õàðàêòåðíî íàëè÷èå â êàòàëèòè÷åñêîì êàðìàíå êîíñåðâàòèâíîé ïîñëåäîâàòåëüíîñòè LAGLIDADG. Áîëüøèíñòâî èíòåèíîâ ÿâëÿþòñÿ DOD-ýíäîíóêëåàçàìè. Îíè ñîäåðæàò äâà DOD-ìîòèâà, êîòîðûå ñîñòàâëÿþò êîð DOD-ýíäîíóêëåàçíîãî äîìåíà (ðèñ. 1). Ïî ïðèíöèïó äåéñòâèÿ DOD-ýíäîíóêëåàçû ÿâëÿþòñÿ ÄÍÊ- è ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 19 ÎÃËßÄÈ Cys Ν-экстеин Cys ИПД-N ИПД-С Ассоциация С-экстеин Asn N-S сдвиг Трансэтерефикация Трансэтерификация Циклизация Asn Удаленный интеин S-N сдвиг Лигированные экстеины Ðèñ. 4. Ñõåìà òðàíñ-ñïëàéñèíãà äâóõ áåëêîâ [13]. ÈÏÄ – èíòåèíïîäîáíûé äîìåí. Mg2+-çàâèñèìûìè ÀÒÐ-àçàìè [9]. Ïðèñóòñòâèå Mg2+ íåîáõîäèìî äëÿ îáåñïå÷åíèÿ ýíäîíóêëåàçíîé àêòèâíîñòè, íî íå èãðàþùåé ñóùåñòâåííîé ðîëè äëÿ ñïåöèôèêè ñâÿçûâàíèÿ [19,20]. Ìåõàíèçì õîóìèíãà èíòåèíîâ îïèñàí âî ìíîãèõ ðàáîòàõ è àíàëîãè÷åí õîóìèíãó èíòðîíîâ 1-ãî òèïà (ðèñ. 5). Èíòåèí êàòàëèçèðóåò äâóõöåïî÷íûé ðàçðûâ â ÄÍÊ. Ïðè ýòîì îáðàçóåòñÿ 3′-âûñòóïàþùèå êîíöû äëèíîé â 4 íóêëåîòèäà (“ëèïêèé” êîíåö) [14,17]. Äàëåå ñ ó÷àñòèåì êëåòî÷íûõ ôåðìåíòîâ äâóõöåïî÷å÷íûé ðàçðûâ ðåïàðèðóåòñÿ ñ èñïîëüçîâàíèåì â êà÷åñòâå ìàòðèöû àëëåëüíîé ÄÍÊ, ñîäåðæàùåé ïîñëåäîâàòåëüíîñòü, êîäèðóþùóþ èíòåèí. Ýòî îáåñïå÷èâàåò ïåðåíîñ åå â àëëåëü(–). Ïîäîáíûì îáðàçîì ãîìîëîãè÷íûå íóêëåîòèäíûå ïîñëåäîâàòåëüíîñòè, ïðèñóòñòâóþùèå â âèðóñàõ, ôàãàõ èëè ïëàçìèäàõ, ìîãóò ïðèîáðåòàòü èíòåèíîâóþ ïîñëåäîâàòåëüíîñòü [3]. Ýòî îáúÿñíÿåò íàëè÷èå â âèðóñíûõ ãåíîìàõ ïîñëåäîâàòåëüíîñòåé ÄÍÊ, ñîîòâåòñòâóþùèõ èíòåèíàì êëåòîê-õîçÿåâ [3,5]. Ïðîñòðàíñòâåííàÿ îðãàíèçàöèÿ èíòåèíà.  ìîëåêóëå èíòåèíà ýíäîíóêëåàçíûé è ñïëàéñèíãîâûå ó÷àñòêè ïðîñòðàíñòâåííî ðàçäåëåíû íà îòäåëüíûå äîìåíû. N- è Ñ-ñïëàéñèíãîâûå äîìåíû îáðàçóþò ïîäêîâîîáðàçíóþ ñòðóêòóðó (ðèñ. 6) [8,13]. Ïðîñòðàíñòâåííîå ðàñïîëîæåíèå êîíöîâ ôèêñèðóåòñÿ ìíîãî÷èñëåííûìè âîäîðîäíûìè ñâÿçÿìè, ýëåêòðîñòàòè÷åñêèìè è ãèäðîôîáíûìè âçàèìîäåéñòâèÿìè, ÷òî îáåñïå÷èâàåò îïòèìàëüíîå ñáëèæåíèå N- è Ñ-êîíöîâ èíòåèíà äî ðàññòîÿíèé, ñîîòíîñèìûõ ñ äëèíîé êîâàëåíòíûõ ñâÿçåé ìåæäó àòîìàìè (ðèñ. 3). N- è Ñ- ñïëàéñèíãîâûå äîìå- 20 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ Экстеин Интеин Экстеин Гомологичная аллель без интеиновой последовательности (+) (-) I I Хромосомная ДНК Транскрипция Хромосомная ДНК Эндонуклеазное расщепление ДНК мРНК Трансляция Интеин Эндонуклеазный домен Белковый сплайсинг Интеин Репарация двухцепочечного разрыва клеточными ферментами с использованием в качестве (+) матрицы I -аллели Активный белок (+) Гомологичная аллель с интеиновой последовательностью I Ðèñ. 5. Ìåõàíèçì õîóìèíãà èíòåèíîâ. íû ôîðìèðóþòñÿ â îñíîâíîì èç β-ñêëàäîê, óëîæåííûõ â òàê íàçûâàåìûå Hint-äîìåíû (àááðåâèàòóðà îò Hedgehog è intein) [8,13]. Îáà ñàéòà ñïëàéñèíãà íàõîäÿòñÿ â öåíòðå Hint-äîìåíà íà êîíöàõ äâóõ àíòèïàðàëëåëüíûõ β-öåïåé (ðèñ. 6). Ñàéò ñïëàéñèíãà èíòåèíà ïî ñòðóêòóðå àíàëîãè÷åí àêòèâíîìó öåíòðó ñåðèíîâûõ ïðîòåàç [3]. Òàê, ñåðèíîâûå ïðîòåàçû êàòàëèçèðóþò ðàçðûâ ïåïòèäíûõ ñâÿçåé ñóáñòðàòà ñ ïîìîùüþ âûñîêîêîíñåðâàòèâíûõ îñòàòêîâ Ser, His è Asp. Àíàëîãè÷íî àâòîñïëàéñèíã èíòåèíà êàòàëèçèðóåòñÿ âûñîêîêîíñåðâàòèâíûìè îñòàòêàìè Ser, Thr èëè Cys íà N-êîíöå èíòåèíà è His-Asn-Ser èëè His-AsnCys íà Ñ-êîíöå ìîëåêóëû (ðèñ. 2).  îáîèõ ñëó÷àÿõ áîêîâàÿ ãðóïïà His àêòèâèðóåò ãèäðîêñèëüíóþ ãðóïïó Ser, êîòîðàÿ íåïîñðåäñòâåííî êîîðäèíèðóåò ãèäðîëèç ïåïòèäíîé ñâÿçè ïðè ó÷àñòèè ìîëåêóë âîäû [3,8]. Ñòðóêòóðà áîëüøèíñòâà DOD-äîìåíîâ ïîäîáíà [17]. Ðàññìîòðèì ñòðîåíèå DOD-äîìåíà íà ïðèìåðå PI-SceI – ýíäîíóêëåàçû èíòåèíà Sce VMA, îäíîãî èç ïåðâûõ èíòåèíîâûõ ýíäîíóêëåàçíûõ äîìåíîâ, ÷üÿ ñòðóêòóðà áûëà îïðåäåëåíà ñ ïîìîùüþ ðåíòãåíîñòðóêòóðíîãî àíàëèçà (ðèñ. 7).  ñåðåäèíå ýíäîíóêëåàçíîãî äîìåíà äâå àíòèïàðàëëåëüíûå α-ñïèðàëè (α4 è α7) ôîðìèðóþò àêòèâíûé öåíòð, ñîäåðæàùèé äâà LAGLIDADG-ìîòèâà – ïî îäíîìó íà êàæäîé α-ñïèðàëè. Íåïîñðåäñòâåííî ñ ÄÍÊ ñâÿçûâàþòñÿ ïî 6 àìèíîêèñëîòíûõ îñòàòêîâ êàæäîãî DOD-ìî- ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 21 Ðèñ. 6. Ëåíòî÷íàÿ ìîäåëü N- è Ñ-ñïëàéñèíãîâûõ äîìåíîâ èíòåèíà Ssp Dna B [8]. Êâàäðàòîì îáîçíà÷åí N-êîíöåâîé ñàéò ñïëàéñèíãà, êðóæêîì – Ñ-êîíöåâîé. Öåíòðàëüíàÿ ÷àñòü èíòåèíà (óñëîâíî îáîçíà÷åíà ïóíêòèðîì) íå ïîêàçàíà. ÎÃËßÄÈ α6 β17 K301 β18 β16 β14 α5 β15 N218 α4 α7 N326 β19 β22 β21 N-сплайсинговый домен K403 С-сплайсинговый домен α8 β20 α9 Ðèñ. 7. Ñòðóêòóðà ýíäîíóêëåàçíîãî äîìåíà PI-SceI (èíòåèí SceVMA) [19]. Êîíñåðâàòèâíûå àìèíîêèñëîòíûå îñòàòêè îáîçíà÷åíû îäíîáóêâåííûìè ñèìâîëàìè. òèâà [14]. Íà Ñ-êîíöàõ ýòèõ ñïèðàëåé íàõîäÿòñÿ äâà âûñîêîêîíñåðâàòèâíûõ Asn218 è Asn326. Îíè àáñîëþòíî íåîáõîäèìû äëÿ îáåñïå÷åíèÿ ýíäîíóêëåàçíîé àêòèâíîñòè. Òðåòüÿ íåîáõîäèìàÿ àìèíîêèñëîòà – Lis301. Asn218, Asn326 è Lis301 ôîðìèðóþò êàòàëèòè÷åñêóþ òðèàäó àêòèâíîãî öåíòðà [18].  ðÿäå ðàáîò ïîêàçàíà òàêæå âàæíàÿ ðîëü ñèììåòðè÷íîé Lis301 àìèíîêèñëîòû Lis403 [19]. Êðîìå DOD-äîìåíà, â îáåñïå÷åíèè ýíäîíóêëåàçíîé àêòèâíîñòè ïðèíèìàåò ó÷àñòèå N-ñïëàéñèíãîâûé äîìåí, ãäå íàõîäèòñÿ ÄÍÊóçíàþùèé ó÷àñòîê (DRR – recognition region, ðèñ. 8). Çíà÷åíèå N-êîíöà èíòåèíà äëÿ îáåñïå÷åíèÿ ýíäîíóêëåàçíîé àêòèâíîñòè áûëî ïîêàçàíî ñ ïîìîùüþ ñàéòíàïðàâëåííîãî ìóòàãåíåçà. Çàìåíû îïðåäåëåííûõ àìèíîêèñëîò â N-ñïëàéñèíãîâîì ó÷àñòêå ðåçêî ñíèæàþò ýíäîíóêëåàçíóþ ñïåöèôè÷íîñòü è àêòèâíîñòü èíòåèíîâ [17]. DOD-ìîòèâû èíòåèíà êàòàëèçèðóþò ýíäîíóêëåàçíûé ðàçðûâ îáåèõ öåïåé ÄÍÊ, íå ñîäåðæàùåé ïîñëåäîâàòåëüíîñòè, êîäèðóþùåé èíòåèí. DOD-äîìåíû âûñîêîñïåöèôè÷íû è, êàê ïðàâèëî, óçíàþò íåïàëèíäðîìíûå ÄÍÊ-ïîñëåäîâàòåëüíîñòè äëèíîé îêîëî 14–40 íóêëåîòèäíûõ ïàð [9,17]. Ïðè ýòîì èíòåèíû óçíàþò äâà ñïåöèôè÷íûõ ó÷àñòêà ÄÍÊ: ñàéò ðåñòðèêöèè, ñ êîòîðûì ñâÿçûâàåòñÿ DOD-äîìåí, è äèñòàëüíóþ îáëàñòü öåëåâîé ïîñëåäîâàòåëüíîñòè, êîòîðàÿ óçíàåòñÿ DRR-ó÷àñòêîì èíòåèíà [21]. Ïîñëåäíÿÿ ñîñòîèò èç 15–17 íóêëåîòèäîâ è ÿâëÿåòñÿ ñóùåñòâåííîé äëÿ âûñîêîàôôèííîãî ñâÿçûâàíèÿ è óçíàâàíèÿ èíòåèíîì òî÷êè ðåñòðèêöèè [19]. Îñíîâíûå ñâîéñòâà èíòåèíîâ.  íàñòîÿùåå âðåìÿ âûäåëÿþò ÷åòûðå îñíîâíûõ ïðèçíàêà, îäíîâðåìåííîå ïðèñóòñòâèå êîòîðûõ â áåëêîâîé ïîñëåäîâàòåëüíîñòè ñâèäåòåëüñòâóåò îá åå èíòåèíîâûõ ñâîéñòâàõ: – â ãåíå ïðèñóòñòâóåò ïîñëåäîâàòåëüíîñòü, êîòîðîé íåò â àíàëîãè÷íûõ ãåíàõ äðóãèõ îðãàíèçìîâ; – ðàçìåðû çðåëîãî áåëêà îòëè÷àþòñÿ îò ïðåäïîëàãàåìûõ ïðè àíàëèçå åãî êîäèðóþùåé ïîñëåäîâàòåëüíîñòè; – ïðèñóòñòâèå ñïåöèôè÷åñêèõ èíòåèíñïëàéñèíãîâûõ ìîòèâîâ À, Â, F, G, òîãäà êàê íàëè÷èå èëè îòñóòñòâèå DOD-ýíäîíóêëåàçíîãî äîìåíà íå ÿâëÿåòñÿ õàðàêòåðíûì ïðèçíàêîì; – íàëè÷èå ÷åòûðåõ êîíñåðâàòèâíûõ àìèíîêèñëîòíûõ îñòàòêîâ íà N-êîíöå èíòåèíà – Ser, Thr èëè Cys (èñêëþ÷èòåëüíî ðåäêî – Ala), íà Ñ-êîíöå – His-Asn èëè His-Gln, íà N-êîíöå Ñ-ýêñòåèíà – Ser, Thr èëè Cys [5]. Èñïîëüçîâàíèå áåëêîâîãî ñïëàéñèíãà â áèî- 22 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ С-конец Ν-конец Ðèñ. 8. Ìîäåëü èíòåèíà PI-SceI: DRR – ÄÍÊ-óçíàþùèé ó÷àñòîê, HINT – Hint-äîìåí, DOD-äîìåí – ýíäîíóêëåàçíûé äîìåí, LAGLIDADG – êàòàëèòè÷åñêèé êàðìàí [17]. òåõíîëîãèè. Îòêðûòèå ÿâëåíèÿ áåëêîâîãî ñïëàéñèíãà, ïîìèìî íåîñïîðèìîãî âêëàäà â ïðåäñòàâëåíèå î ìîëåêóëÿðíûõ îñíîâàõ æèçíè, ïîçâîëèëî ïî-íîâîìó ïîäîéòè ê ðåøåíèþ ðÿäà áèîòåõíîëîãè÷åñêèõ çàäà÷. Íèæå ìû ðàññìîòðèì îñíîâíûå áèîòåõíîëîãè÷åñêèå ìåòîäû, îñíîâàííûå íà èñïîëüçîâàíèè èíòåèíîâ. Ñèñòåìû î÷èñòêè ðåêîìáèíàíòíûõ áåëêîâ íà îñíîâå èíòåèíîâ.  áèîëîãèè ñ 70-õ ãîäîâ ïðîøëîãî âåêà äëÿ î÷èñòêè áåëêîâ ÷àñòî èñïîëüçîâàëè ðàçëè÷íûå àôôèííûå ñèñòåìû. Îäíàêî ðÿä ñóùåñòâåííûõ îãðàíè÷åíèé íå ïîçâîëèëî ýòîìó ìåòîäó ñòàòü óíèâåðñàëüíûì è êîììåð÷åñêè âûãîäíûì. Îäèí èç ïîïóëÿðíûõ ñïîñîáîâ ïðåäïîëàãàåò ýêñïðåññèþ õèìåðíîãî öåëåâîãî áåëêà, ñëèòîãî ñ àôôèííîé ìåòêîé, â ÷àñòíîñòè ñ ãëóòàòèîí-S-òðàíñôåðàçîé (GST) èëè ìàëüòîçîñâÿçûâàþùèì áåëêîì E.coli (MBP) [22].  ýòîì ñëó÷àå äëÿ ôàðìàöåâòè÷åñêîãî ïðèìåíåíèÿ î÷èùåííûé ðåêîìáèíàíòíûé ïðîäóêò íåîáõîäèìî áûëî îáðàáàòûâàòü ïðîòåàçàìè äëÿ îòùåïëåíèÿ àôôèííîé ìåòêè îò öåëåâîãî áåëêà. Îäíàêî äåéñòâèå ïðîòåàç íå âñåãäà îêàçûâàåòñÿ òî÷íûì è ñïåöèôè÷åñêèì. Êðîìå òîãî, ýòî âûíóæäàåò ïðîâîäèòü äîïîëíèòåëüíûå ïðîöåäóðû î÷èñòêè áåëêà îò îòùåïëåííîé àôôèííîé ãðóïïû. Îòêðûòèå èíòåèíîâ ïîçâîëèëî ïî-íîâîìó ïîäîéòè ê ïðîáëåìå àôôèííûõ ìåòîê. Èñïîëüçóÿ èíòåèí â êà÷åñòâå ëèíêåðà ìåæäó öåëåâûì áåëêîì è ìåòêîé, ìîæíî äîáèòüñÿ òîãî, ÷òî ïîñëå î÷èñòêè àôôèííàÿ ìåòêà áóäåò îòùåïëÿòüñÿ îò öåëåâîãî áåëêà âñëåäñòâèå àâòîñïëàéñèíãà èíòåèíà. ßâíûì ïðåèìóùåñòâîì òàêîãî ìåòîäà ÿâëÿåòñÿ òî, ÷òî áåëêîâûé ñïëàéñèíã íå òðåáóåò äîïîëíèòåëüíûõ êîôàêòîðîâ èëè ñëîæíîãî îáîðóäîâàíèÿ. Ìíîãèå àâòîðû ïîêàçàëè, ÷òî èíäóöèðîâàòü ñïëàéñèíã èíòåèíà ìîæíî íåïîñðåäñòâåííî íà àôôèííîì ñîðáåíòå, íà êîòîðîì ïðîâîäèëàñü î÷èñòêà áåëêà. Ïåðâûå ðàáîòû ïî ñîçäàíèþ âåêòîðîâ äëÿ î÷èñòêè áåëêîâ ñâèäåòåëüñòâóþò, ÷òî ñëèÿíèå èíòàêòíîãî èíòåèíà ñ áåëêîì íå äàåò íóæíîãî ýôôåêòà, ïîñêîëüêó ñïëàéñèíã ïðîõîäèò âíóòðè êëåòêè-ïðîäóöåíòà [22,23]. Ïîýòîìó äëÿ ñîçäàíèÿ èíòåèíîïîñðåäîâàííîé ñèñòåìû î÷èñòêè áûëî ïðåäëîæåíî èñïîëüçîâàòü èíòåèíû ñ àìèíîêèñëîòíûìè çàìåíàìè [3,23]. Çàìåíà îäíîé èëè äâóõ êðèòè÷åñêèõ äëÿ ñïëàéñèíãà àìèíîêèñëîò ïîçâîëÿåò äîáèòüñÿ òîãî, ÷òî in vivo àâòîñïëàéñèíã îñóùåñòâëÿòüñÿ íå áóäåò.  òî æå âðåìÿ in vitro ñïëàéñèíã ìîæíî èíäóöèðîâàòü òèîëüíûìè ñîåäèíåíèÿìè, òàêèìè êàê äèòèîòðèèòîë (ÄÒÒ), β-ìåðêàïòîýòàíîë èëè öèñòåèí. Íà îñíîâå ýòîãî ïðèíöèïà áûëà ñîçäàíà òåõíîëîãèÿ àôôèííîé î÷èñòêè áåëêà, íàçâàííàÿ IMPACT-ñèñòåìîé (Intein Mediated Purification with Affinity Chitinbinding Tag).  IMPACT-ñèñòåìå ýêñïðåññèðóåòñÿ õèìåðíûé áåëîê, ñõåìàòè÷åñêè ïðåäñòàâëåííûé íà ðèñ. 9, À. Öåëåâîé áåëîê ïðèñîåäèíÿåòñÿ ê N-êîíöó ìîäèôèöèðîâàííîãî èíòåèíà Sce VMA, ñ Ñ-êîíöîì êîòîðîãî ñâÿçàíà àôôèííàÿ ìåòêà – õèòèíñâÿçûâàþùèé äîìåí (ÑÂD) èç Bacillus circulans. Î÷èñòêà öåëåâîãî áåëêà ïðîâîäèòñÿ ñ ïîìîùüþ àôôèííîé õðîìàòîãðàôèè íà õèòèíñåôàðîçå. Îòùåïëåíèå åãî ïðè N-ñïëàéñèíãå èíäóöèðóåòñÿ ÄÒÒ èëè ìåðêàïòîýòàíîëîì. Äëÿ ïðåäîòâðàùåíèÿ àâòîñïëàéñèíãà in vivo Asn454 â Ñ-ñïëàéñèíãîâîì äîìåíå çàìåùàþò íà Ala (çàìåíà Asn454Ala). Ýòî äàåò âîçìîæíîñòü ïðîâîäèòü òîëüêî N-êîíöåâîé ñïëàéñèíã ïóòåì àòàêè òèîëîâûìè ñîåäèíåíèÿìè, à òàêæå íå äîïóñêàåò ñëèÿíèÿ öåëåâîãî áåëêà ñ àôôèííîé ìåòêîé. Äâîéíàÿ çàìåíà Íis453Leu/Ñys455Ser òàêæå áëîêèðóåò àâòîñïëàéñèíã in vivo è ïîçâîëÿåò èíäóöèðîâàòü åãî in vitro ñ ïîìîùüþ ÄÒÒ [23]. Òàêèì áûë ïåðâûé ìåòîä èñïîëüçîâàíèÿ èí- ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 23 ÎÃËßÄÈ À NН2 Целевой белок Интеин CBD Á СООН NН2 N-кэп Интеин CBD Целевой белок Ðèñ. 9. Ñõåìàòè÷åñêîå èçîáðàæåíèå õèìåðíûõ áåëêîâ, èñïîëüçóåìûõ â IMPACT (À) IMPACT-ÑN (Á) -ñèñòåìàõ. è òåèí-ñèñòåì äëÿ àôôèííîé î÷èñòêè áåëêîâ. Îäíàêî ïîñëå ðåàëèçàöèè åãî íà ïðàêòèêå áûë îáíàðóæåí ðÿä íåäîñòàòêîâ âûøåîïèñàííîé î÷èñòêè. Âîò îñíîâíûå èç íèõ: – N-êîíöåâàÿ ïîñëåäîâàòåëüíîñòü îïðåäåëÿåò óðîâåíü ýêñïðåññèè õèìåðíîãî áåëêà [22]. Ïîìåùàÿ öåëåâîé áåëîê íà N-êîíåö âåêòîðà, ìû íå ìîæåì ìîäèôèöèðîâàòü åãî äëÿ óñèëåíèÿ ýêñïðåññèè ãåíà. – Âêëþ÷åíèå ïðîêàðèîò ïðè ýêñïðåññèè ãåíîâ â êëåòêàõ â ñîñòàâ áåëêà N-êîíöåâîãî ôîðìèëìåòèîíèíà, êîòîðûé íåîáõîäèìî îòäåëèòü äëÿ èñïîëüçîâàíèÿ öåëåâîãî áåëêà â ôàðìàêîëîãèè. – Ïðè èíäóêöèè N-ñïëàéñèíãà èíòåèíà òèîëüíûé àãåíò êîâàëåíòíî ñâÿçûâàåòñÿ ñ Ñ-êîíöîì öåëåâîãî áåëêà, ìîäèôèöèðóÿ åãî (ðèñ. 10) [24–26]. Íà ôèçèêî-õèìè÷åñêèå ñâîéñòâà áåëêà ýòî ìîæåò è íå âëèÿòü, ÷òî ïîçâîëÿåò èñïîëüçîâàòü î÷èùåííûå òàêèì îáðàçîì áåëêè â ëàáîðàòîðíîé ïðàêòèêå [24,26]. Îäíàêî â ôàðìàêîëîãè÷åñêèõ öåëÿõ èõ ïðèìåíåíèå íåäîïóñòèìî. Îäíàêî èäåÿ ñîçäàòü ñàìîóäàëÿþùóþñÿ àôôèííóþ ìåòêó áûëà íàñòîëüêî çàìàí÷èâîé, ÷òî ðàáîòû â ýòîé îáëàñòè íå ïðåêðàùàëèñü.  êîíöå 1990-õ ãîäîâ áûëà ðàçðàáîòàíà IMPACT-ÑN-ñèñòåìà. Ïðè èñïîëüçîâàíèè IMPACT-ÑN-ñèñòåìû öåëåâîé áåëîê ñîåäèíÿåòñÿ ñ Ñ-êîíöîì ìîäèôèöèðîâàííîãî èíòåèíà Sce VMA. Àôôèííàÿ ìåòêà (ÑÂD) íàõîäèòñÿ ïðè ýòîì â öåíòðàëüíîé îáëàñòè èíòåèíà íà ìåñòå ýíäîíóêëåàçíîãî äîìåíà (ðèñ. 9, Á). Ê N-êîíöó èíòåèíà äîáàâëÿëè N-êýï: 10 N-êîíöåâûõ àìèíîêèñëîò ìàëüòîçîñâÿçûâàþùåãî áåëêà (ÌÂÐ) èëè GST äëÿ óñèëåíèÿ ýêñïðåññèè õèìåðíîãî áåëêà [22]. Ýòî ïîâûøàåò åå ýôôåêòèâíîñòü â IMPACT-ÑN-êîíñòðóêòàõ ïî ñðàâíåíèþ ñ ýêñïðåññèåé IMPACT-êîíñòðóêòîâ (òàáë. 2). Äëÿ ïðåäîòâðàùåíèÿ ñïëàéñèíãà in vivo â ìîëåêóëå èíòåèíà áûëè ïðîâåäåíû çàìåíû Íis453Gln/Cys455Ala. Îäíàêî îíè íå ïðåïÿòñòâîâàëè èíäóêöèè ñïëàéñèíãà ÄÒÒ èëè öèñ- òåèíîì è íå âëèÿëè íà ýôôåêòèâíîñòü Ñ-ñïëàéñèíãà [3,22,23]. Îáðàáîòêà õèìåðíîãî áåëêà òèîëüíûìè àãåíòàìè ñðàçó èíäóöèðóåò îòäåëåíèå N-êîíöåâîãî êåïà (ðèñ. 10). Ýòî, â ñâîþ î÷åðåäü, âûçûâàåò îòùåïëåíèå öåëåâîãî áåëêà îò Ñ-êîíöà èíòåèíà. Âñå ïîëó÷åííûå äàííûå ñâèäåòåëüñòâóþò î òîì, ÷òî îòäåëåíèå N-ýêñòåèíà èíäóöèðóåò îòùåïëåíèå Ñ-ýêñòåèíà [3,22,23]. Âåðîÿòíî, òèîëèíäóöèðîâàííîå îòñîåäèíåíèå N-ýêñòåèíà íàðóøàåò êîíôîðìàöèþ èíòåèíà, ÷òî ñòèìóëèðóåò öèêëèçàöèþ Asn454 è âûçûâàåò ðàñùåïëåíèå ñâÿçè ìåæäó èíòåèíîì è öåëåâûì áåëêîì (ðèñ. 10). Îäíàêî IMPACT-CN-ñèñòåìà î÷èñòêè áåëêîâ òàêæå èìååò íåäîñòàòêè: – íåîáõîäèìîñòü âòîðîãî ýòàïà î÷èñòêè äëÿ îòäåëåíèÿ N-êîíöåâîãî ïåïòèäà, – äëèòåëüíîñòü ïðîöåññà – èíêóáàöèÿ ñ òèîëüíûìè àãåíòàìè â òå÷åíèè äâóõ äíåé ïîçâîëÿåò ïîëó÷èòü âñåãî îêîëî 50% î÷èùåííîãî öåëåâîãî áåëêà. Êðîìå òîãî, äëÿ îáåèõ ñèñòåì ýêñïðåññèè õàðàêòåðíû òàêèå îáùèå íåäîñòàòêè, êàê íåîáõîäèìîñòü èñïîëüçîâàíèÿ ÄÒÒ èëè ìåðêàïòîýòàíîëà, ÷òî âûçûâàåò äîïîëíèòåëüíûå òðóäíîñòè ïðè î÷èñòêå ôàðìàöåâòè÷åñêèõ ïðîäóêòîâ, à áîëüøîé ðàçìåð Sce VMA (îêîëî 50 êÄà) çíà÷èòåëüíî ñíèæàåò ïðîäóêòèâíîñòü ïðîêàðèîòè÷åñêèõ ñèñòåì ñèíòåçà áåëêà. Ïîýòîìó ñåé÷àñ âåäåòñÿ ïîèñê íîâûõ ñèñòåì î÷èñòêè öåëåâûõ áåëêîâ íà îñíîâå èíòåèíîâ [8]. Ïîëèïåïòèäëèãèðóþùèå ñèñòåìû íà îñíîâå èíòåèíîâ. Îäíîé èç èíòåðåñíûõ âîçìîæíîñòåé èñïîëüçîâàíèÿ èíòåèíîâ ÿâëÿåòñÿ ðàçðàáîòêà ïîëèïåïòèäëèãèðóþùèõ ñèñòåì. Íàïðàâëåííîå ïðèìåíåíèå òðàíñ-ñïëàéñèíãà îòêðûëî íåáûâàëûå ïåðñïåêòèâû â ðàçðàáîòêå íîâûõ âèäîâ ïðåïàðàòîâ, áèîñåíñîðîâ è áèîìàòåðèàëîâ. Èíòåèíîïîñðåäîâàííîå ëèãèðîâàíèå áåëêîâ ïîçâîëÿåò ïðîâîäèòü áèîëîãè÷åñêè ïðèåìëåìîå ñøèâàíèå ðàç- 24 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ Ò à á ë è ö à 2. Óðîâåíü ýêñïðåññèè õèìåðíûõ áåëêîâ â IMPACT- è IMPACT-ÑN- ñêîíñòðóèðîâàííûõ áåëêàõ [22] Целевой белок IMPACT- белок, мг/л IMPACT- СN- белок, мг/л Активность Т4 ДНК- лигаза Т4 продукт гена 32 Fse1 GFR РРI 8,0 <0 , 1 <0,5 <0,5 0,6 8,4 6,0 2,0 1,9 1,9 + + + + + CamKII 0,8 2,2 − − 1,7 − Инвертаза ëè÷íûõ ïîëèïåïòèäíûõ öåïåé.  ÷àñòíîñòè, èñïîëüçîâàíèå òðàíñ-ñïëàéñèíãà ïîçâîëÿåò ðåøèòü îäíó èç àêòóàëüíåéøèõ çàäà÷ – èììîáèëèçàöèþ ôåðìåíòîâ íà íîñèòåëå áåç ïîòåðè èõ àêòèâíîñòè. Íàïðèìåð, â ðàáîòå [27] ñ ïîìîùüþ àêòèâàöèè ïåïòèäîâ, âûçâàííîé N- è Ñ-êîíöåâûì îòùåïëåíèåì èíòåèíà Sce VMA, óäàëîñü ëèãèðîâàòü ìàëüòîçîñâÿçûâàþùèé áåëîê (ÌÂÐ) è Ò4 ÄÍÊ-ëèãàçó (ðèñ. 11).  ýòèõ èññëåäîâàíèÿõ ïîêàçàíî, ÷òî ïðè ýòîì àêòèâíîñòü Ò4-ëèãàçû íå èñ÷åçàåò.  îáçîðå [3] òàêæå îïèñàí ïðèìåð ñîçäàíèÿ áèîñåíñîðà ñ ïîìîùüþ èíòåèíîïîñðåäî- Сys1 âàííîãî ëèãèðîâàíèÿ áåëêîâ (ðèñ. 12). Ñ ïîìîùüþ èíòåèíîïîñðåäîâàííîé òåõíîëîãèè ìåæäó SH2- è SH3-äîìåíàìè áåëêà àbl ââîäÿò ôëóîðîôîð Dns (5-äèìåòèëàìèíî-íàôòàëåí-1-ñóëüôîíàìèä). Ïîëó÷åííûé ïîëóñèíòåòè÷åñêèé ïðîòåèí ñïîñîáåí ñâÿçûâàòü ñïåöèôè÷åñêèå ëèãàíäû (â ò.÷. ôîñôîòèðîçèí), è ñ ïîìîùüþ ôëóîðîôîðà âèçóàëèçèðîâàòü èõ ïðèñóòñòâèå [3]. Êðîìå îïèñàííûõ âûøå ñâîéñòâ, èñïîëüçîâàíèå èíòåèíîâ ïîçâîëÿåò òàêæå îñóùåñòâëÿòü öèêëèçàöèþ ïåïòèäîâ è áåëêîâ. Ñ ïîìîùüþ èíòåèíîâ âîçìîæíî ïðîâåñòè öèêëèçàöèþ áåëêà ïî Gln453 Ala455 Пдт Ν-экстеин С-экстеин Интеин Sce VMA Asn454 N-S сдвиг ДТТ-индуцированный N-сплайсинг ДТТ-модифицированный N-экстеин С-концевой сплайсинг (циклизация Asn) Удаленный интеин С-экстеин Ðèñ. 10. Ñõåìà ÄÒÒ-èíäóöèðîâàííîãî ñïëàéñèíãà ìîäèôèöèðîâàííîãî èíòåèíà SceVMA [23]. ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 25 ÎÃËßÄÈ N-концевой сплайсинг H2N-- MBP С-концевой сплайсинг Интеин CBD --COOH H2N-- CBD Интеин Т4 лигаза --COOH Иммобилизация конструктов на хитин-сефарозе Хитинсефароза H2N-- MBP Интеин CBD CBD Интеин Т4 лигаза --COOH 4оС ДТТ или β-меркаптоэтанол H2N-- Интеин Инкубация при комнатной температуре, рН 7,0 CBD CBD МВР Интеин --COOH Т4 лигаза Стандартное химическое лигирование очищенных белков МВР Т4 лигаза Ðèñ. 11. Ñõåìà ëèãèðîâàíèÿ äâóõ ïåïòèäîâ ñ ïîìîùüþ èíòåèíîâ [27]: MBP – ìàëüòîçîñâÿçûâàþùèé áåëîê E. coli, CBD – õèòèíñâÿçûâàþùèé äîìåí B. circulans, èíòåèí – èíòåèí Sce VMA. ïðèíöèïó “ãîëîâà – õâîñò”. Ìåòîä, ñ ïîìîùüþ êîòîðîãî ìîæíî öèêëèçèðîâàòü áåëêè, ïîëó÷èë íàçâàíèå SICLOPPS (Split Intein-mediated Circular Ligation Of Peptide and ProteinS) [28]. Ñõåìà ïðîöåññà ñîçäàíèÿ öèêëè÷åñêîãî áåëêà ïðåäñòàâëåíà íà ðèñ. 13. Ñóòü ìåòîäà çàêëþ÷àåòñÿ â ñëåäóþùåì – ýêñïðåññèðóþò õèìåðíûé áåëîê In-ÄÃÔÐIc (In-äèãèäðîôîëàòðåäóêòàçà-Ic), ãäå In è Ic ÿâëÿþòñÿ N- è Ñ-êîíöåâûìè ÷àñòÿìè èíòåèíà ñîîòâåòñòâåííî, à ÄÃÔÐ – ôåðìåíòîì E. coli. Ïðîöåññ öèêëèçàöèè ïðîèñõîäèò ïî ìåõàíèçìó òðàíññïëàéñèíãà: In è Ic àññîöèèðóþò äðóã ñ äðóãîì ñ îáðàçîâàíèåì àêòèâíîãî èíòåèíà. Ïîñëå ýòîãî ïî ñòàíäàðòíîìó ìåõàíèçìó, îïèñàííîìó âûøå, ïðî- èñõîäèò ñïëàéñèíã ñ ïîñëåäóþùèì ëèãèðîâàíèåì N- è Ñ-êîíöà ÄÃÔÐ.  ðåçóëüòàòå ôåðìåíòàòèâíàÿ àêòèâíîñòü “öèêëî”-ÄÃÔÐ íå èç÷åçàåò, çàòî ñóùåñòâåííî ïîâûøàåòñÿ ïåðèîä ïîëóæèçíè è òåðìîñòàáèëüíîñòè áåëêà [28]. Ýêñïðåññèÿ òîêñè÷íûõ äëÿ êëåòêè ïðîäóêòîâ. ×àñòî ýóêàðèîòè÷åñêèå áåëêè, ýêñïðåññèðóåìûå â êëåòêàõ ïðîêàðèîò, ÿâëÿþòñÿ òîêñè÷íûìè äëÿ êëåòêè-ïðîäóöåíòà. Ýòî íå ïîçâîëÿåò íàðàáàòûâàòü íåîáõîäèìûå áåëêè â äîñòàòî÷íîì êîëè÷åñòâå. Èñïîëüçîâàíèå ñèñòåì ýêñïðåññèè íà îñíîâå èíòåèíîâ ìîæåò ðåøèòü ýòó ïðîáëåìó. Òîêñè÷íûå äëÿ êëåòêè áåëêè ìîæíî íàðàáàòûâàòü â âèäå íåàêòèâíûõ õèìåðíûõ ïðåäøåñòâåííèêîâ. 26 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ Ха – Cys— -—CO—SR + Cys —-- SH2 Лигирование 1 Dns Xa —Cys— SH2 Протеолиз (+ фактор Ха*) SH3 - —CO—SR + Cys— SH2 Лигирование 2 SH3 SH2 Ðèñ. 12. Áèîñåíñîð íà îñíîâå èíòåèíîïîñðåäîâàííîãî ìåòîäà. Ñ ïîìîùüþ ïîñëåäîâàòåëüíûõ ëèãèðîâàíèé ôðàãìåíòîâ áåëêîâ ôëóîðîôîð (Dns) àññîöèèðóþò ñ SH2- è SH3-äîìåíàìè áåëêà abl. Ïîñëå êîíäåíñàöèè ñèíòåòè÷åñêîãî ïåïòèäà ñ Ñ-òåðìèíàëüíûì SH2-äîìåíîì êîíüþãàò îáðàáàòûâàþò ôàêòîðîì Õà c îáðàçîâàíèåì àêòèâèðîâàííîãî N-êîíöåâîãî öèñòåèíà, ïî êîòîðîìó ïðîâîäÿò ëèãèðîâàíèå õèìåðíîãî áåëêà ñ SH3-äîìåíîì Abl [3]. *Õà – ïåïòèä, îòùåïëÿåìûé ïîä äåéñòâèåì ôàêòîðà Õà. Òàêîé ïîäõîä îïèñàí â ëèòåðàòóðå. Èíòåèí Psp-GBD Pol ÄÍÊ-ïîëèìåðàçû áûë âêëþ÷åí â îäíó ðàìêó ñ÷èòûâàíèÿ ìåæäó ãåíîì ìàëüòîçîñâÿçûâàþùåãî áåëêà è ãåíîì ïàðàìèîçèíà Dirofilaria immitis.  ðåçóëüòàòå îáðàçîâûâàëñÿ íåòîêñè÷íûé ïðåäøåñòâåííèê, êîòîðûé ïðè òåìïåðàòóðå 12–20 °Ñ íå âêëþ÷àëñÿ â àâòîñïëàéñèíã. Íåàêòèâíûé ïðåäøåñòâåííèê ïàðàìèîçèíà èçîëèðîâàëè îò áåëêîâ êëåòî÷íîãî ëèçàòà ñ ïîìîùüþ àôôèííîé õðîìàòîãðàôèè. Ïîâûøåíèå òåìïåðàòóðû äî 37–65 °Ñ èíäóöèðîâàëî ñïëàéñèíã, ÷òî ñïîñîáñòâîâàëî ýëþèðîâàíèþ ñ êîëîíêè àêòèâíîãî î÷èùåííîãî áåëêà [3]. Òàêîé ïîäõîä ïîçâîëÿåò íàðàáàòûâàòü òîêñè÷íûå äëÿ êëåòêè áåëêè â âèäå íåàêòèâíûõ õèìåðíûõ ïðåäøåñòâåííèêîâ, êîòîðûå ïðè ïîâûøåíèè òåìïåðàòóðû ïðåâðàùàþòñÿ â ïîëåçíûå áåëêîâûå ïðîäóêòû. Áåëêîâûé ñïëàéñèíã òàêæå ìîæíî èíäóöèðîâàòü è âíåøíèìè àãåíòàìè, â ÷àñòíîñòè îïèñàíà àêòèâàöèÿ ðåêîìáèíàíòíûõ ìàðêåðíûõ áåëêîâ ïðè äåéñòâèè èçëó÷åíèÿ â âèäèìîé èëè óëüòðàôèîëåòîâîé ÷àñòè ñïåêòðà [3]. Òàêèì îáðàçîì, ìîæíî ñèíõðîíèçèðîâàòü ñïëàéñèíã áåëêîâûõ ïðå- ïàðàòîâ, íàïðèìåð äëÿ àêòèâàöèÿ áåëêîâîãî ïðåïàðàòà â ìîìåíò âñêðûòèÿ ñâåòîíåïðîíèöàåìîé óïàêîâêè. Òàêèì îáðàçîì, ìû ïîïûòàëèñü îáîáùèòü â ýòîì îáçîðå îñíîâíûå äàííûå, èìåþùèåñÿ â ëèòåðàòóðå. Ñî âðåìåíè îòêðûòèÿ èíòåèíîâ ïðîøëî 15 ëåò. Çà ýòî âðåìÿ áåëêîâûé ñïëàéñèíã èç î÷åðåäíîé çàãàäêè ïðèðîäû ïðåâðàòèëñÿ â õîðîøî èçó÷åííûé ïðîöåññ, íà îñíîâå êîòîðîãî ðàçðàáîòàíû ðàçëè÷íûå áèîòåõíîëîãè÷åñêèå ìåòîäû. Îäíàêî äî ñèõ ïîð áèîëîãè÷åñêèå ôóíêöèè èíòåèíîâ íå îïðåäåëåíû. Ãëàâíûé âîïðîñ, êîòîðûé “âèñèò â âîçäóõå”, – ýòî êàêîâà áèîëîãè÷åñêàÿ öåëåñîîáðàçíîñòü áåëêîâîãî ñïëàéñèíãà è ÷òî îí äàåò êëåòêå. Íåêîòîðûå àâòîðû ñ÷èòàþò ïîñëåäîâàòåëüíîñòè, êîäèðóþùèå èíòåèí, îäíèì èç ïðîÿâëåíèé “ýãîèñòè÷åñêîé” ÄÍÊ. Äðóãèå ïîëàãàþò, ÷òî îíè ñïîñîáíû ðåãóëèðîâàòü ýêñïðåññèþ áëèçëåæàùèõ ãåíîâ [29,30]. Èçâåñòíî òàêæå ìíåíèå, ÷òî èíòåèíû èãðàëè îïðåäåëåííóþ ðîëü â ðàííèõ ýâîëþöèîííûõ ïðîöåññàõ [3,30]. Ýòî êîñâåííî ïîäòâåðæäàåòñÿ èõ ðàñïðîñòðàíåííîñòüþ â ïðèðîäå: îíè îáíàðóæåíû ó ïðåä- ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 27 ÎÃËßÄÈ In ДГФР Ic Ser Cys Asn Активный интеин S-N ацильный сдвиг Ν-сплайсинг С-сплайсинг (циклизация Asn) S-N-ацильный сдвиг Циклический предшественник Циклический белок Интеин Ðèñ. 13. Ñõåìà ìåõàíèçìà öèêëèçàöèè áåëêà ìåòîäîì SICLOPPS [28]. ÄÒÔÐ – äèãèäðîôîëàòðåäóêòàçà. ñòàâèòåëåé âñåõ òðåõ âåòâåé æèçíè, â ò.÷. ó ýóêàðèîò, ýóáàêòåðèé è àðõåáàêòåðèé [31]. Íî íàøèõ çíàíèé ïîêà íåäîñòàòî÷íî äëÿ òîãî, ÷òîáû ïîëó÷èòü îäíîçíà÷íûå îòâåòû íà ýòè è åùå ìíîãèå äðóãèå âîïðîñû. Àâòîð âûðàæàåò áëàãîäàðíîñòü Ëüâó Àëåêñååâè÷ó Ñòàðîêàäîìñêîìó çà êðèòè÷åñêèå çàìå÷àíèÿ è ïîìîùü ïðè îôîðìëåíèè ñòàòüè. PROTEIN SPLICING P. L. Starokadomskij Most of inteins consist of N- and C-terminal protein splicing domain and central endonuclease domain. The endonuclease domain can initiate mobility of the intein gene, this process being named intein homing. This review is focused on the recent data about the structure and function of inteins. Main intein-mediated protein-engineering applications, such as protein purification, ligation and cyclization, new forms of biosensors, are presented. K e y w o r d s: intein, protein splicing, homing, protein purification. Inteins are internal polypeptide sequences that are posttranslationally excised from a protein precursor by a self-catalyzed protein-splicing reaction. 1. Kane P. M., Yamashiro C. T., Wolczyk D. F. et al. // Science. 1990. 250, N 4981. P. 651–657. 2. Perler F., Davis E., Dean G. et al. // Nucl. Acids Research. 1994. 22, N 7. P. 1125–1127. 3. Noren C., Wang J., Perler F. // Angew. Chem. Int. Ed. engl. 2000. 39, N 3. P. 450–466. 4. Pietrokovski S. // Protein Science. 1994. N 3. P. 2340–2350. 28 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 Institute of Molecular Biology and Genetics, National Academy of Sciences of Ukraine, Kyiv; e-mail: [email protected] Summary Ï. Ë. ÑÒÀÐÎÊÀÄÎÌÑÊÈÉ 5. Perler F. // Nucl. Acids Research. 2002. 30, N 2. P. 383–384. 6. Perler F., Olsen G., Adam E. // Ibid. 1997. 25, N 6. P. 1087–1093. 7. Pietrokovski S. // Protein Science. 1998. N 7. P. 64–71. 8. Ding Y., Xu M., Ghosh I. et al. // J. Biol. Chem. 2003. 278, N 40. P. 39133–3914. 9. Guhan N., Muniyappa K. // Nucleic Acids Research. 2003. 31, N 14. P. 4184–4191. 10. Clarke N. // Proc. Natl. Acad. Sci. USA. Biochemistry. 1994. 91. P. 11084–11088. 11. Ingham P. W., McMahon A. P. // Genes and Devel. 2001. 15. P. 3059–3087. 12. Roessler E., Belloni E., Gaudenz K. et al. // Hum. Molec. Genet. 1997. 6, N 11, P. 1847– 1853. 13. Ghosh I., Sun L., Xu M. // J. Biol. Chem. 2001. 276, N 26. P. 24051–24058. 14. Lykke A., Garrett R., Kjems J. // Nucl. Acids Research. 1996. 24, N 20. P. 3982–3989. 15. Flick K. E., Jurica M. S., Monnat P. G., Stoddard B. L. // Nature. 1998. 394, N 2. P. 96– 101. 16. Chong S., Xu M. // J. Biol. Chem. 1997. 272, N 25. P. 15587–15590. 17. Bakhrat A., Jurica M., Stoddard B., Raveh D. // Genetics. 2004. 166. P. 721–728. 18. He Z., Crist M., Yen H. et al. // J. Biol. Chem. 1998. 273, N 8. P. 4607–4615. 19. Gimble F., Duan X., Hu D., Quiocho F. // J. Biol. Chem. 1998. 273, N 46. P. 30524–30529. 20. Dalgaard J., Klar A., Moser M. et al. // Nucl. Acids Research. 1997. 25, N 22. P. 4626–4638. 21. Hu D., Crist M., Duan X. et al. // J. Biol. Chem. 2000. 275, N 4. P. 2705–2712. 22. Chong S., Montello G., Zhang A. et al. // Nucl. Asids Research. 1988. 26, N 22. P. 5109–5115. 23. Chong S., Williams K., Wotkowicz C., Xu M. // J. Biol. Chem. 1998. 273, N 17. P. 10567– 10577. 24. Noue K., Demel R., de Kruijff B., Keegstra K. // Eur. J. Biochem. 2001. N 268. P. 4036–4043. 25. Wood D. // J. Chem. Techn. and Biotechn. 2003. N 78. P. 103–110. 26. Yu R., Hong A., Dai Y., Gao Y. // Acta Biochim. et Biophys. Sinica. 2004. 36, N 11. P. 759– 766. 27. Evans T., Benner J., Xu M. // J. Biol. Chem. 1999. 274, N 7. P. 3923–3926. 28. Scott Ch., Wall M., Wahnon D. et al. // PNAS. 1999. 96, N 24. P. 13638–13643. 29. Perler F. B. // Trends Biochem Sci. 1999. 24, N 6. P. 209–211. 30. Porter J. A., Ekker S. C., Park W. J. et al. // Cell. 1996. 86, N 1. P. 21–34. 31. Komori K., Fujita N., Ichiyanagi K. et al. // Nucl. Acids Research. 1999. 27, N 21. P. 4167– 4182. Ïîëó÷åíî 18.03.2005 ISSN 0201 — 8470. Óêð. á³îõ³ì. æóðí., 2005, ò. 77, ¹ 4 29