博亚体育app官网
Mou Mou Jidian Generator
发电机维修 发电机回收
发电机出售 发电机租赁
客户统一服务热线

0542-99046195
18544774686

您的位置: 主页 > 新闻中心 > 常见问题 >

给基因取一个温暖的名字,HGNC教你给基因取名

本文摘要:❑ 导 读融合基因用/还是用-?SEPT/MARCH系列名称使用EXCEL处置惩罚时还需要人工检查吗?你除了使用 NCBI Entrez GeneID外是否还使用过HGNC ID吗?接下来,本文带你聊聊基因命名的历程。

博亚app官网下载

❑ 导 读融合基因用"/"还是用"-"?SEPT/MARCH系列名称使用EXCEL处置惩罚时还需要人工检查吗?你除了使用 NCBI Entrez GeneID外是否还使用过HGNC ID吗?接下来,本文带你聊聊基因命名的历程。本文系贵州生命大数据研究院原创编译,接待分享,转载须授权1 基因命名的历史与孝敬人类基因命名委员会(Human Gene Nomenclature Committee) 在1979年开始致力于基因命名尺度化,他们审批研究人员对人类基因命名和重命名,并将审批通过的基因名称和符号记载到各个数据库。1989年人类基因组组织(Human Genome Organization ,简称:HUGO)正式建立并接受人类基因命名委员会,更名为人类基因组组织-基因命名委员会(HUGO Gene Nomenclature Committee,简称:HGNC),并对人类基因命名规则举行了麋集的修订。

迄今为止,HGNC已经命名了凌驾40000小我私家类基因座,其中约莫有一半是编码卵白质的基因。除了卵白质编码基因的命名外,差别种别的RNA基因和伪基因的命名规则也取得了重大希望。所有批准通过的人类基因符号均可在HGNC在线数据库中检索到(https://www.genena2 HGNC基因命名的原则及应用HGNC遵循人类基因命名生长变化的原则,追随生命科学领域的新技术和新发现进而对基因的命名举行修订和完善。但随着基因组学在临床上的应用日益广泛,让所有临床医生、患者、慈善机构和科研人员接受新的基因命名是具有很浩劫度的。

所以基因命名的稳定性,特别是与疾病相关的基因命名的稳定性至关重要。HGNC要求研究人员命名或者重命名基因的时候联系他们,通过他们审批该命名是否建立。对于审批通过的命名,HGNC会将该命名将记载进入生物数据库。

对于审批不通过的命名申请,HGNC会为研究人员提供其他指导名称。HGNC进一步勉励期刊编辑和审稿人检查所审文章是否使用了经由批准的基因命名,并要求作者在揭晓任何新的基因符号之前应联系他们。

下图为IncRNAs命名申申请的HGNC审核流程示例: 3 怎么为你的新发现起个名序列变异命名法。这属于人类基因组变异学会(Human Genome Variation Society,简称:HGVS)的职责规模,该学会为剖析DNA、RNA和卵白质序列的变异的命名提供建议。

基因易位或融合的产物的命名。使用”/“启用”-“将两个或多个基因举行毗连命名。例如:SYMBOL1-SYMBOL2被广泛使用,但HGNC建议使用SYMBOL1/SYMBOL2花样。

关于使用卵白质命名法。HGNC与酶委员会(Enzyme Commission)密切互助编写了《国际卵白质命名法指南》(https://www.ncbi.nlm.nih.gov/genome/doc/internatprot_nomenguide/)。凭据其中的准则,建议卵白质和基因符号应该使用相同的缩写。

调控基因组元件的命名法。调控元件包罗启动子、增强子和转录因子联合位点。该类元件凭据Mayer et al.的尺度来命名。与临床表型和庞大性状相关的人类基因座的命名法。

虽然HGNC以前曾为这些基因座命名,但这一事情已被在线人类孟德尔遗传数据库(Online Mendelian Inheritance in Man ,简称:OMIM)接受。4 HGNC人类基因命名规则HGNC将基因界说为“具有特定功效的DNA片段,在功效不明确的情况下,基因具有序列特征、转录特征或同源性特征“。理想情况下,对基因命名的符号要简短、容易影象和发音,而且大多数基因名称应是对基因符号的详细形貌。基因名称应该简短而详细,应该转达基因产物的特征或功效,但不求能形貌关于该基因的一切特征。

每个基因只有一个符号,对基因的差别转录本不举行命名(转录本包罗ncRNA 亚型、ncRNA选择性转录本等)。特殊情况下,在庞大的复合位点中,基因片段使用奇特的基因符号。例如:假定的双顺反子基因座可以使用差别的符号来表现差别的基因产物。

通常情况下基因命名遵从如下规则:1. 每一个基因被命名为唯一符号,包罗HGNC ID和形貌性名称。2. 基因符号只包罗大写拉丁字母和阿拉伯数字。

3. 基因符号不应与常用的缩写相同。4. 命名法不应包罗任何物种名称或使用“G”表现基因。

5.命名法不应带有冒犯或贬损的情感色彩。5 凭据生物特性命名编码基因对于编码卵白质的基因,HGNC凭据该基因编码的产物来命名该基因。

当一个基因编码多个卵白时,以其中最关键的、功效最普遍的卵白质来命名该编码基因。通常是基于序列的同源性,功效的相似性或在卵白质复合体中的成员关系来确定相关基因。相关基因使用一个配合的根符号来命名,以实现分组。

博亚app官网下载

基因家族成员使用根符号后面的阿拉伯数据举行区分(例如,KLF1, KLF2和KLF3),偶然也在根符号后面添加单字母后缀(例如,LDHA、LDHB和LDHC)。对于到场特异性免疫历程的基因,或编码酶、受体或离子通道的基因,HGNC会咨询专业命名小组。对于编码的卵白功效不清楚的情况下,卵白质编码基因可以用以下方式命名。

1. 基于该编码基因公认的结构域和基序命名(如:ABHD1,abhydrolase domain containing1);2. 基于人类基因组内的同源基因命名(每个同源家族都有一个唯一的家族编号(如:FAM3);3. 基于另一物种的同源基因命名(如:CDC45,cell division cycle45,它是基于酿酒酵母CDC45命名);4. 基于开放命名框架的命名,该框架预设为:染色体编号+orf+序数(如:C3orf18)。6 凭据生物特性命名假基因假基因是与功效基因具有高度同源性的序列但不能发生功效性卵白的基因。

针对假基因(Pseudogenes)的命名规则如下:如果假基因被经由处置惩罚,则凭据其同源亲本基因举行命名(如DPP3P1,DPP3 pseudogene 1)。如果假基因没有被经由处置惩罚,则在其同源亲本基因后添加后缀“ P”形成新家族成员(如CBWD4P,COBW domain containing 4,pseudogene)。参考基因组中有少数基因是假基因,但在群体中存在编码等位基因。

这些基因座被赋予“卵白质编码”的基因型,通过在基因名末了的“(gene/pseudogene)”表现(如:CASP12,“caspase12(gene/pseudogene)”)。7 凭据生物特性命名其他基因对于非卵白编码RNA基因的命名(Non-coding RNA genes),凭据非卵白编码RNA基因的RNA类型来命名(如MIR32,MicroRNA-32)。

针对功效或特征已知的长链非编码RNA,可凭据其功效或特征来命名。由相邻基因座发生的基因,包罗两个(或多个)基因的编码和/或非编码区域称为通读转录本(Readthrough transcripts),使用亲原来源的两个(或多个)基因相连命名(如INS-IGF2 readthrough)。

对于基因片段(Gene segments),对于特定的庞大基因座,根据学术需求单独命名。基因组区域(Genomic regions),HGNC不再为基因组区域命名,但保留以往已揭晓的基因组区域命名。8 群体亚群和脊椎动物基因命名HGNC只批准了人类参考基因组中的基因符号。

在群体亚群中发现的基因由基因组参考协会(Genome Reference Consortium,简称:GRC)统一命名(如HLA和KIR基因家族中的结构变异)。此外,具有庞大进化史的基因家族最幸亏该领域专家的资助下命名。脊椎动物(Naming across vertebrates) 基因的名命由脊椎动物基因命名委员会命名(Vertebrate Gene Nomenclature Committee,简称:VGNC),现已建设五个脊椎动物命名委员会,脊椎动物基因命名委员会卖力对现在未命名的椎骨物种基因举行尺度化命名。9 基因术语更新偏向1、占位符的符号更新,例如FAMs, C#orfs 和 KIAAs被视为占位符,并尽可能使用基于结构的、函数的名称举行更新。

2、形貌不充实或有问题术语的更新:i. 接纳更合适或更常用的别名,例如:RNASEN更新到DROSHA(drosha ribonuclease III),因为行业内里更多人使用DROSHA;ii. 基于结构域或基序的命名,例如:TMEM206(transmembrane protein 206)现在更新为PACC1(proton activated chloride channel 1);iii. 基于疾病或表型的命名,例如:CASC4(cancer sensitivity candidate 4)被重新命名为GOLM2 (golgi membrane protein 2),去掉了对表型的参考,并与其同源GOLM1保持一致;iv. 基于基因组位置的命名,例如:TWISTNB (TWIST neighbor) 更名为POLR1F (RNA polymerase I subunit F);v. 具有歧义符号,例如:DOPEY1更名为DOP1A (DOP1 leucine zipper like protein A);vi. 误导性或不正确的术语,例如:OTX3最初被错误地认为是OTX家族成员,现在已经被重新命名DMBX1(diencephalon/mesencephalon homeobox 1);vii. 影响数据处置惩罚和检索的术语,例如:所有在Excel中会自动转换成日期的符号,SEPT1现在更改为SEPTIN1、MARCH1更改为MARCHF1。同样常见的tRNA合成酶符号已经被改变,WARS更改为 WARS1; CARS 更改为 CARS1。

3、基因符号使用形式更新:使用斜体来表现基因,等位基因和RNA;使用正体表现卵白质。参考资料:Bruford, E.A., Braschi, B., Denny, P. et al. Guidelines for human gene nomenclature. Nat Genet 52, 754–758 (2020). https://doi.org/10.1038/s41588-020-0669-3原文毗连:https://www.nature.com/articles/s41588-020-0669-3。


本文关键词:博亚app下载官方网站,给,基因,取,一个,温暖,的,名字,HGNC,教,你给,❑

本文来源:博亚体育app官网-www.jxxiezhu.com

Copyright © 2008-2022 www.jxxiezhu.com. 博亚体育app官网科技 版权所有  ICP备案:ICP备36514272号-6