CELSR1
білок-кодуючий ген Homo Sapiens
CELSR1 (англ. Cadherin EGF LAG seven-pass G-type receptor 1) – білок, який кодується однойменним геном, розташованим у людей на короткому плечі 22-ї хромосоми.[3] Довжина поліпептидного ланцюга білка становить 3 014 амінокислот, а молекулярна маса — 329 486[4].
Послідовність амінокислот
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MAPPPPPVLP | VLLLLAAAAA | LPAMGLRAAA | WEPRVPGGTR | AFALRPGCTY | ||||
AVGAACTPRA | PRELLDVGRD | GRLAGRRRVS | GAGRPLPLQV | RLVARSAPTA | ||||
LSRRLRARTH | LPGCGARARL | CGTGARLCGA | LCFPVPGGCA | AAQHSALAAP | ||||
TTLPACRCPP | RPRPRCPGRP | ICLPPGGSVR | LRLLCALRRA | AGAVRVGLAL | ||||
EAATAGTPSA | SPSPSPPLPP | NLPEARAGPA | RRARRGTSGR | GSLKFPMPNY | ||||
QVALFENEPA | GTLILQLHAH | YTIEGEEERV | SYYMEGLFDE | RSRGYFRIDS | ||||
ATGAVSTDSV | LDRETKETHV | LRVKAVDYST | PPRSATTYIT | VLVKDTNDHS | ||||
PVFEQSEYRE | RVRENLEVGY | EVLTIRASDR | DSPINANLRY | RVLGGAWDVF | ||||
QLNESSGVVS | TRAVLDREEA | AEYQLLVEAN | DQGRNPGPLS | ATATVYIEVE | ||||
DENDNYPQFS | EQNYVVQVPE | DVGLNTAVLR | VQATDRDQGQ | NAAIHYSILS | ||||
GNVAGQFYLH | SLSGILDVIN | PLDFEDVQKY | SLSIKAQDGG | RPPLINSSGV | ||||
VSVQVLDVND | NEPIFVSSPF | QATVLENVPL | GYPVVHIQAV | DADSGENARL | ||||
HYRLVDTAST | FLGGGSAGPK | NPAPTPDFPF | QIHNSSGWIT | VCAELDREEV | ||||
EHYSFGVEAV | DHGSPPMSSS | TSVSITVLDV | NDNDPVFTQP | TYELRLNEDA | ||||
AVGSSVLTLQ | ARDRDANSVI | TYQLTGGNTR | NRFALSSQRG | GGLITLALPL | ||||
DYKQEQQYVL | AVTASDGTRS | HTAHVLINVT | DANTHRPVFQ | SSHYTVSVSE | ||||
DRPVGTSIAT | LSANDEDTGE | NARITYVIQD | PVPQFRIDPD | SGTMYTMMEL | ||||
DYENQVAYTL | TIMAQDNGIP | QKSDTTTLEI | LILDANDNAP | QFLWDFYQGS | ||||
IFEDAPPSTS | ILQVSATDRD | SGPNGRLLYT | FQGGDDGDGD | FYIEPTSGVI | ||||
RTQRRLDREN | VAVYNLWALA | VDRGSPTPLS | ASVEIQVTIL | DINDNAPMFE | ||||
KDELELFVEE | NNPVGSVVAK | IRANDPDEGP | NAQIMYQIVE | GDMRHFFQLD | ||||
LLNGDLRAMV | ELDFEVRREY | VLVVQATSAP | LVSRATVHIL | LVDQNDNPPV | ||||
LPDFQILFNN | YVTNKSNSFP | TGVIGCIPAH | DPDVSDSLNY | TFVQGNELRL | ||||
LLLDPATGEL | QLSRDLDNNR | PLEALMEVSV | SDGIHSVTAF | CTLRVTIITD | ||||
DMLTNSITVR | LENMSQEKFL | SPLLALFVEG | VAAVLSTTKD | DVFVFNVQND | ||||
TDVSSNILNV | TFSALLPGGV | RGQFFPSEDL | QEQIYLNRTL | LTTISTQRVL | ||||
PFDDNICLRE | PCENYMKCVS | VLRFDSSAPF | LSSTTVLFRP | IHPINGLRCR | ||||
CPPGFTGDYC | ETEIDLCYSD | PCGANGRCRS | REGGYTCECF | EDFTGEHCEV | ||||
DARSGRCANG | VCKNGGTCVN | LLIGGFHCVC | PPGEYERPYC | EVTTRSFPPQ | ||||
SFVTFRGLRQ | RFHFTISLTF | ATQERNGLLL | YNGRFNEKHD | FIALEIVDEQ | ||||
VQLTFSAGET | TTTVAPKVPS | GVSDGRWHSV | QVQYYNKPNI | GHLGLPHGPS | ||||
GEKMAVVTVD | DCDTTMAVRF | GKDIGNYSCA | AQGTQTGSKK | SLDLTGPLLL | ||||
GGVPNLPEDF | PVHNRQFVGC | MRNLSVDGKN | VDMAGFIANN | GTREGCAARR | ||||
NFCDGRRCQN | GGTCVNRWNM | YLCECPLRFG | GKNCEQAMPH | PQLFSGESVV | ||||
SWSDLNIIIS | VPWYLGLMFR | TRKEDSVLME | ATSGGPTSFR | LQILNNYLQF | ||||
EVSHGPSDVE | SVMLSGLRVT | DGEWHHLLIE | LKNVKEDSEM | KHLVTMTLDY | ||||
GMDQNKADIG | GMLPGLTVRS | VVVGGASEDK | VSVRRGFRGC | MQGVRMGGTP | ||||
TNVATLNMNN | ALKVRVKDGC | DVDDPCTSSP | CPPNSRCHDA | WEDYSCVCDK | ||||
GYLGINCVDA | CHLNPCENMG | ACVRSPGSPQ | GYVCECGPSH | YGPYCENKLD | ||||
LPCPRGWWGN | PVCGPCHCAV | SKGFDPDCNK | TNGQCQCKEN | YYKLLAQDTC | ||||
LPCDCFPHGS | HSRTCDMATG | QCACKPGVIG | RQCNRCDNPF | AEVTTLGCEV | ||||
IYNGCPKAFE | AGIWWPQTKF | GQPAAVPCPK | GSVGNAVRHC | SGEKGWLPPE | ||||
LFNCTTISFV | DLRAMNEKLS | RNETQVDGAR | ALQLVRALRS | ATQHTGTLFG | ||||
NDVRTAYQLL | GHVLQHESWQ | QGFDLAATQD | ADFHEDVIHS | GSALLAPATR | ||||
AAWEQIQRSE | GGTAQLLRRL | EGYFSNVARN | VRRTYLRPFV | IVTANMILAV | ||||
DIFDKFNFTG | ARVPRFDTIH | EEFPRELESS | VSFPADFFRP | PEEKEGPLLR | ||||
PAGRRTTPQT | TRPGPGTERE | APISRRRRHP | DDAGQFAVAL | VIIYRTLGQL | ||||
LPERYDPDRR | SLRLPHRPII | NTPMVSTLVY | SEGAPLPRPL | ERPVLVEFAL | ||||
LEVEERTKPV | CVFWNHSLAV | GGTGGWSARG | CELLSRNRTH | VACQCSHTAS | ||||
FAVLMDISRR | ENGEVLPLKI | VTYAAVSLSL | AALLVAFVLL | SLVRMLRSNL | ||||
HSIHKHLAVA | LFLSQLVFVI | GINQTENPFL | CTVVAILLHY | IYMSTFAWTL | ||||
VESLHVYRML | TEVRNIDTGP | MRFYYVVGWG | IPAIVTGLAV | GLDPQGYGNP | ||||
DFCWLSLQDT | LIWSFAGPIG | AVIIINTVTS | VLSAKVSCQR | KHHYYGKKGI | ||||
VSLLRTAFLL | LLLISATWLL | GLLAVNRDAL | SFHYLFAIFS | GLQGPFVLLF | ||||
HCVLNQEVRK | HLKGVLGGRK | LHLEDSATTR | ATLLTRSLNC | NTTFGDGPDM | ||||
LRTDLGESTA | SLDSIVRDEG | IQKLGVSSGL | VRGSHGEPDA | SLMPRSCKDP | ||||
PGHDSDSDSE | LSLDEQSSSY | ASSHSSDSED | DGVGAEEKWD | PARGAVHSTP | ||||
KGDAVANHVP | AGWPDQSLAE | SDSEDPSGKP | RLKVETKVSV | ELHREEQGSH | ||||
RGEYPPDQES | GGAARLASSQ | PPEQRKGILK | NKVTYPPPLT | LTEQTLKGRL | ||||
REKLADCEQS | PTSSRTSSLG | SGGPDCAITV | KSPGREPGRD | HLNGVAMNVR | ||||
TGSAQADGSD | SEKP |
Кодований геном білок за функціями належить до рецепторів, g-білокспряжених рецепторів, білків внутрішньоклітинного сигналінгу, білків розвитку, фосфопротеїнів. Задіяний у такому біологічному процесі, як альтернативний сплайсинг. Білок має сайт для зв'язування з іоном кальцію. Локалізований у клітинній мембрані, мембрані.
Література
ред.- Wu Q., Maniatis T. (2000). Large exons encoding multiple ectodomains are a characteristic feature of protocadherin genes. Proc. Natl. Acad. Sci. U.S.A. 97: 3124—3129. PMID 10716726 DOI:10.1073/pnas.97.7.3124
- The status, quality, and expansion of the NIH full-length cDNA project: the Mammalian Gene Collection (MGC). Genome Res. 14: 2121—2127. 2004. PMID 15489334 DOI:10.1101/gr.2596504
Примітки
ред.- ↑ Human PubMed Reference:.
- ↑ Mouse PubMed Reference:.
- ↑ HUGO Gene Nomenclature Commitee, HGNC:1850 (англ.) . Архів оригіналу за 17 жовтня 2015. Процитовано 12 вересня 2017.
- ↑ UniProt, Q9NYQ6 (англ.) . Архів оригіналу за 12 жовтня 2017. Процитовано 12 вересня 2017.
Див. також
ред.Це незавершена стаття про білки. Ви можете допомогти проєкту, виправивши або дописавши її. |