推荐活动

一个基因改名引发的群殴

首页 » 产业 » 杂谈 2014-10-02 科学网薛宇 赞(2)
分享: 
导读
群殴:表观遗传学42人(甲方) vs. 细胞生物学57人(乙方)

  我发现各个国家的学者们作报告的风格是特点鲜明又截然不同。每张幻灯一篇论文,一个报告听下来除了你知道这人发文章多以外其他啥都没听明白的,这是咱中国的学者;一个报告正儿八经讲一件事儿,走严谨、扎实的路线,最后稍稍拔高那么一点点儿的,这是欧洲的学者;一个工作就俩仨数据,故事讲的惊天地泣鬼神,搞的你觉得不发俩炸药奖给人家都不好意思的,这是美国的学者;故事平淡无奇,但实验数据多到让你抓狂,并且解决任何问题一律是万年不变的穷举法,这个必然是日本的学者。当然咱做报告一直也是塞文章的风格,后来Shirley受不了了,很委婉的建议:你做报告甭拼命塞文章成不?你就讲一件事情讲清楚就得了,这样大家也能学习点儿什么。所以这几年正在积极的改变风格,等再出去给报告,讲完雄雷不干了,说你小子做报告怎么跟写博客一样,就那点儿破事儿你咋能整出这么多废话?我。。。
  讲正事儿。话说当年刚进实验室,对生物一窍不通,就问老板咱做的是啥?老板于是就给我讲了一个至少到目前仍然是我最喜欢的一个故事,当时是基本没听明白,但有一件事情搞懂了:细胞有意思。所以我研究生的专业是分子细胞生物学,受过相当严格的训练,后来转做生物信息学,那也只不过是研究方法变了,关心的问题依然是细胞周期 (Cell cycle)。最近正在准备写的一篇博文,就是希望讲这个故事,不过需要看的文献比较多,所以一直是慢悠悠的看。前几天浏览网页,点进了我老板的博士后老板,唐·克利夫兰教授 (Prof. Don W.Cleveland)的实验室网站。唐是我要讲的另一个故事主角的学生,在细胞生物学领域是鼎鼎有名并且多才多艺的学者,代表性的工作至少有:

      1) 发现微管结合蛋白(Microtubuleassociated protein) Tau,这是个明星分子,在神经系统里表达量高,并且与阿尔茨海默病有关(Alzheimer's disease),在PubMed数据库里,Tau相关的论文有34,000多篇,而2004年发过诺奖的另一个明星分子泛素 (Ubiquitin),相关的文献也不过41,000多篇。

      2) 发现微管蛋白家族的主要成员,后来他老板和他师弟在此基础上提出了“微管动态不稳定”(Dynamicinstability of microtubule) 的调控机制,并且研究这个概念的策略,很大程度上促进了细胞生物学领域“研究范式”(Paradigm) 的形成。

      3) 发现驱动蛋白(Kinesin) CENP-E,负责连接着丝粒/动点 (Centromere/kinetochore) 和微管,是动点这个研究领域的奠基人之一。唐的贡献很多,06年入选美国科学院院士(National Academy of Sciences),2013年当选美国细胞生物学学会的主席 (American Society for Cell Biology, 2013)。
  浏览唐的发表论文列表,别的没看见,一眼就看见了“回复”(response) 这个词,并且直接点了对手的名(CENP-A and the CENPnomenclature: response to Talbert and Henikoff),第一反应就是:这是打架的节奏啊!于是怀着沉(xi)重(yue)的心情赶紧看看。文章看完明白了,总共两场架,第一场是群殴,第二场算是个2 vs.2的PK。这场架里唐是乙方,所以我们也有请甲方出场。能跟、并且敢跟美国生命科学领域里重量级学会之一的时任总舵主过招,这肯定不是一般人,最起码得是个美国的科学院院士是吧?对,你没有猜错,05年入选的美国科学院院士,比唐还早一年,史蒂文·海宁科夫(Steven Henikoff)教授。史蒂文在咱生物信息学领域,那绝对是名人堂级别的人物。最主要的贡献就是设计了BLOSUM系列矩阵。在之前的博文《生物信息之拍案惊奇:爸爸去哪儿了?【三】》里,我曾经介绍过生物信息学他妈玛格丽特·奥克雷·戴霍夫 (Margaret OakleyDayhoff)的贡献,即首次提出序列比对算法必须用到的打分矩阵PAM系列。问题是史蒂文的BLOSUM系列矩阵的想法更合理、模型更简单、计算更精准、并且应用更方便,所以直接把PAM矩阵KO到了课本里变成古董。问题是史蒂文不光做生信,他拿院士前后已经开始做表观遗传学(Epigenetics),并且主要的研究兴趣就是着丝粒。早在2002年,史蒂文等人在PlantCell上的一篇论文里,在拟南芥里发现了一个“着丝粒H3类似组蛋白”(CentromericH3-like histone) HTR12,这个名称无论是英文还是翻成中文都实在是太长了,因此在07年的一篇PNAS论文里,史蒂文将之缩写成了CenH3。给发现的基因命名,似乎并没有什么不妥,不过这就为后来这场群殴埋下了伏笔。
  一、群殴:表观遗传学42人(甲方) vs. 细胞生物学57人(乙方)
  2012年,世界各地的42位表观遗传学家们开了一个会,主要的内容就是规范组蛋白 (Histone)的命名,开完会之后将讨论的最终结果在Epigenetics & chromatin这个杂志上发表了一篇论文。主要的内容有:1) 真核生物里组蛋白数量很多,命名五花八门的,并且同一个基因一堆名字,搞的人头大,所以规范组蛋白的基因名称是必须的;2) 组蛋白的家族分类和命名,主要参照分子进化树的结果;3) 鼓励大家使用标准名称,尽量别用稀奇古怪的名字。作者还以CenH3为例,说着丝粒结合的组蛋白每个真核生物基本就一个,在人类叫CENP-A,芽殖酵母里叫Cse4, 拟南芥里叫HTR12,并且在进化树上还分不到一块儿去,也就是说不是起源于共同祖先的,所以干脆按照功能命名,这一家子都叫CenH3得了。
  这就出大事了。因为至少人类CENP-A这个名称,是绝对不可以动的,如果这个名字改掉了,那么整个动点的研究领域都可能崩溃。所以唐等人总共57位从事动点研究的学者在2013年发表了一篇驳斥性的论文。主要的观点就一个:CenH3是不合适的,着丝粒结合的组蛋白“世界语”(Esperanto) 应该叫CENP-A。理由有:1) CENP-A (Centromere protein A) 是由这篇驳斥性论文的一作,威廉?恩肖 (William C. Earnshaw) 等人于1985年在人类细胞里发现的,后来CENP就被大家看成是着丝粒结合蛋白命名的标准前缀,现在已经发现并命名到CENP-X了。2) CENP-A在酵母里叫Cse4,在果蝇里叫Cid,为啥不改成CENP-A呢?因为学术界的传统是谁发现谁命名,这俩蛋白质在发现其定位于着丝粒之前已经被命名了,所以不能瞎改;3) 你们小圈子开会瞎改组蛋白的名字,问题是这篇论文里的作者们一个都不知道,这像话吗?
  基因或蛋白质名称统一,这是好事情,但之所以变成群殴的原因在于:你统一基因名称没问题,可问题是你不能关上门搁自己家里统一名称,完了什么都按你的来,这还讲不讲学术的规矩?要统一大家得一起坐下来谈不是?你要真叫上咱,那咱说什么不能让你改了CENP-A这名字:CENP-A没了,那其他那些CENP弟兄们该放哪儿呢?那这个研究领域还不如关门大吉得了。
  所以这场群殴的结果是,甲方:以后都听哥的哈。乙方上去一顿狂砍,完了撂下一句话:边儿呆着去。目测甲方没讨着便宜。
  二、2 vs. 2的单挑
  本来应该是一届成功的大会,喜庆的大会,富有成果的大会,结果给弄成群殴并且还被人鄙视不懂江湖规矩,怎么说史蒂文也是顶级学者,这口气咋能咽的下去?真要咽下去了,以后还咋带小弟们啊?所以二话不说,甲方一作和史蒂文联合又发表了一篇论文,主要观点有:1) 哥们我上篇文章就2%的内容稍微提了一下着丝粒特异性的组蛋白,踩你尾巴啦?搞那么激动干啥的?2) 着丝粒特异性组蛋白每个物种也就一个,命名五花八门的,并且做进化树还归类不到一起去,你瞧瞧我们在拟南芥里还发现个HTR12,我统一叫成CenH3,不是也让步了嘛?3) 分子进化/系统发育应该是组蛋白命名的标准,你恩肖制定的啥破规则?20几个相互之间没有一点关联的蛋白质,你非要放在压根就不存在的家族里,这唱的是哪出啊?4) 就算是CENP-A,那也不是你恩肖首次发现的,对吧?
  所以说不愧是院士,就是有水平。前面两点无关痛痒的,但后面两条相当的要命。因为CENP系列的蛋白质,相互之间在序列和结构上都没有关联。并且CENP-A的的确确不是恩肖首次发现。这下看起来师公算是彻底被翻盘了不是?
  当然不是。因为这一轮挑衅的作者就俩,所以应战的自然也就俩:威廉·恩肖和师公。在回复的论文里,师公的反驳是:1) 按照分子进化分类并命名并不是唯一的学术规则,比如免疫系统里抗原表位分类,之间也没什么相似性不是?这种例子多了去了。所以拿这个不能说事儿。2) CENP之所以叫CENP,那是因为分类是根据细胞结构和功能来分的,咱搞细胞认的是功能,功能!懂吗?3) CENP-A的确不是恩肖首次发现,那是因为1984年首次发现的时候宣称这不是个组蛋白,而就在这篇论文正式发表的三天之后,恩肖等人发现包括这个蛋白在内的三个定位于着丝粒的蛋白质,并使用了CENP的命名规则,将这三个蛋白质命名为CENP-A, -B, -C。所以恩肖首次正确发现CENP-A的功能,这个是木有问题的。4)这得叫CENP-A,不叫CenH3。
  结论:第一,在生命科学领域,基因、蛋白质命名不是乱,而是乱的一塌糊涂,一个基因可以有几十个不同的名字,不同的基因也可以有相同的名字,例如APC,既可以是结肠腺瘤样息肉基因 (Adenomatous polyposis coli),也可以是细胞有丝分裂后期促进复合物 (Anaphase promoting complex)。当年做学生的时候一直搞不懂为什么不同的东西还能给起成一个名字?听了半天解释,明白了,大致就是有俩学者互相看不顺眼,其中一个起了个名字,另一个二话不说把一个完全不相关的东西起成同样的东西,就为了恶心对方。当年听到这个解释我真是被雷住了:这也行?所以基因名称的统一是必须的,也是趋势。第二,统一基因名称是好事儿,问题是讨论的时候该请的得请上,尤其是发现者,人家还在世呢,你公开改人家的东西这不大好吧?闭门造车不是什么好事。第三,搜了一下文献,基本大家还是继续沿用CENP-A,毕竟做动点蛋白质的学者,比做着丝粒表观遗传学的学者人数要多,坚持用CenH3的,主要还是史蒂文自己,当然在写论文的时候,也一定是加上“也叫CENP-A”(Also called CENP-A) 之类的说明,毕竟是斯文人,该讲的规矩那还是得讲的。第四,话说我咋这么爱凑热闹呢?不过高手打架看着还是蛮过瘾的。(转化医学网360zhyx.com)

评论:
评 论
共有 0 条评论

    还没有人评论,赶快抢个沙发

相关阅读