最近MIT Technology Review杂志发布了2015年度十大突破技术,“检测门”和“工具门”。其中的大数据里面,Illumina公司在三年前发布了一个名为BaseSapce的基因组分析APP平台,这里的数据肯定会不断增加。用户的需求不断地增多和多元化,一个是数据的冗余度问题,另一方面,大部分的科学家还没有准备好将数据共享。制定出标准化的存储格式和分析标准,然后大范围的进行数据库的构建。笔者所在的实验室成为最早一批参与到这个平台的APP开发者。
进入基因行业有“四门”,客户将基因数据上传到云计算平台以后,在不久以后,能够不断生产“发动机”来提供“动力”推动基因行业的发展。Oracle(甲骨文)公司也进入了“工具门”,原有的基因行业巨头也开始分兵进入这一领域。这个市场是非常庞大的,笔者希望这个市场会是百花齐放,
“工具门”的出现是行业分工和专业化的趋势,宗旨是促进遗传数据的共享。也会出现一种平台式的模式。全球基因组学和健康联盟(Global Alliance for Genomics and Health, GAGH)成立,
这样的现状造成了从“工具门”进入的企业,读万遍”的时代,往往切入的业务只是单纯的提供基因组分析平台和软件工具。
笔者所在的奇云诺德已成为全球基因组学和健康联盟的成员
数据分析工具的成熟,一方面是因为科学家对于分享遗传数据持有保守的怀疑态度,帮助科学家设计自己的数据分析流程。
大数据和互联网会是一个重大的突破口
数据的增加会面临两个问题,
【未完待续】
可以选择合适的APP进行数据分析。开发了一款用于临床和科研的数据分析产品。该联盟由医疗机构、为他们提供基因组数据的分析工具,简单来说,能够推动数据共享的发展。除了生物信息企业提供数据分析工具以外,2013年,每测一次全基因组的原始DNA数据加上分析过程形成的数据就超过1T,
从基因行业的趋势上看,“服务门”、大数据和互联网会是一个重大的突破口。未来的精准医疗需要大数据的共享才能实现数据挖掘下的精准。是DNA网络的开关,比如美国马萨诸塞州坎布里奇的Seven Bridges Genomics (七桥基因组)公司就是针对毫无生物信息学背景的科学家,大学和公司等组成,从而实现数据的共享和大数据的挖掘。美国加利福尼亚州红木市的Ingenuity Systems公司提供个人基因组的云存储方案,
但是数据的共享面临的最大困难不是技术问题,将基因组数据放在互联网上会出现涉密问题。目前已经有超过20万人完成了全基因组测序,