The Seventh layer of the Clinical-genomics information infrastructure
临床基因信息学应用层的基础结构。
主要内容:
1介绍HL7**CG标准.通过这个标准能够把病人的临床信息,结合当前的科学知识和特殊病人的基因数联系起来。核心是“encapsulate and bubble-up”工作流。
2.介绍CGL7,描述CGL7在几个原始用例中的实现。
主要创新点:
构建了一个从隐性到显性的关系层,也就是将人的基因数据和临床诊断数据联系起来。“encapsulate and bubble-up”工作流在CGL7中的应用是亮点。
1.HL7**CG标准
1.1HL7(略)
1.2 The HL7 CG 标准
1.3 The “encapsulate and bubble-up” workflow
Encapsulate阶段 把原始数据按照一定的格式用生物信息标记语言(BSML)进行封装成HL7 CG消息,这里的格式是已经提前预定义好的。
。 bubble-up阶段:在这个阶段是一个不断的重复的过程:在各种面向染色体组的决策支持应用程序中解析被封装的原始基因数据,并标记出对临床诊断,病人治序,医学研究有意义的部分。
Bubble-up 与总结或评注的区别:临床染色体组数据是很难总结的,这是因为:在这个领域的很多的知识还是未知的,bubble-up是一个不断的挖掘新信息的过程,直到找到临床诊断和基因之间的孙系。注释和评论是bubble-up过程的结果。
Encapsulate and bubble-up workflow在特定的时期对特定的病人的原始的诊断和治序数据能不断的筛选,尽可能的找出有效数据,以便以后能够再次解析。
1.4CGL7中使用模式
HL7 Clinical genomics specifications中的核心模式是:GeneticLocus模式(基因位模式)。包括序列,表式和蛋白质数据。在基因模式中,用分析复杂生物信息学的标记语言描述(满足HL7设计规则的)相关信息,为Encapsulate and bubble-up workflow提供数据信息。GeneticLoci是基因位的集合(GeneticLocus)。GeneticLocus和GeneticLoci是HL7 Clinical genomics中的组织类型用例演绎过来的。GeneticLoci模式用于描述单模标本,GeneticLocus模式适合于描述等位基因。
2. 介绍CGL7,描述CGL7在几个原始用例中的实现。
CGL7是用用Web服务技术标准实现的,允许CGL7快速集成各种不同的客户应用程序。由于,HL7 Clinical genomics数据量非常大,尤其是encapsulated的数据,所在为了避免数据的来回传输,许多CGL7的用例中采用了多步处理过程,如Encapsulation和两种不同的Bubble-up策略在CGL7中的应用(见文章图4)。
文章描述的CGL7API用法结构图见文章图6。
这个图的流程:把XML实例导入到解析器,解析器结合消息说明(在HL7消息交换格式中)解析导入进来的消息,把解析出的有效的内容送入内存中,进行相关处理,同样串化器也结合消息说明正确的串行内存中的对象到XML中。
HL7 API还为保存HL7 XML 实例到关系数据库中提供了支持。
文章还介绍了bubble-up策略的相关实例