周公解梦 梦见洗头当前新闻业务的发展对基于事件的报道管理和组织有着迫切的需求,但国内正在使用的各种新闻标准和采编系统均没有从系统设计上很好地满足这种需求。另一方面,根据建立多业态发展的需要,新闻产品及资源需要提供更加多元化的展示方式。相比于传统的按照时间顺序展示新闻,按新闻主题事件组合展示的方式逐渐被广泛使用。例如,以新闻事件为中心组织报道和的编辑加工,以市场为导向进行新闻产品的生产,尤其是面向新兴用户,提供满足个性化需求、基于专题和突发事件的产品营销和展示方式。这一多报道形式的转变,要求新闻信息管理平台能够提供基于事件的新闻组织管理和展示方式。对此,国外通讯社(德新社、)已经建立相应的技术系统。IPTC 发布的NewsML G2 标准就是其中的代表性。 综上,中文新闻事件标准的制定和应用已经是必然的趋势。报道策划和新闻事件信息置言(Reporting Planing and News Event Markup Language, 以下简称REML)标准恰好满足了以上对于新闻数据标准的需求,为实现适合新闻业务特点和发展要求的基于事件的新闻组织模式、报道管理模式和新闻产品供稿模式提供了的基础,也填补了国内相关领域的一项空白。 REML 标准的需求主要分为业务流程需求和数据需求两个方面,其中,业务流程需求是根本,数据需求是对业务流程需求在元数据层面的具体化表现。 根据新闻事件报道的业务流程,大致上可以将新闻事件分为有计划事件和突发事件两种。两种新闻事件在报道流程上略有不同。 (1)准备阶段指事件报道还未开始,进行事件前的各项准备工作阶段。该阶段主要包括事件发起(确定事件的大致内容、时间表等信息),报道准备(确定参与事件报道工作的人力、设备等资源),报道组织(依据事件时间表和人力物力等资源,安排报道的详细计划)三个步骤。 (2)进行阶段指事件报道已开始,随时根据事件进展发布、更新事件相关信息的过程。该阶段主要的工作内容就是根据实际报道工作过程中产生的各种反馈信息调整事件数据和报道组织数据,并及时发送给各个需求方。 (3)结束阶段指事件报道已经终止,对报道工作进行后期总结、汇总和整理的过程。该阶段的工作主要步骤是报道总结(对报道管理信息的统计分析),以及事件归档(将事件信息加工成完整成熟的事件知识库词条)。 突发事件报道流程由于突发事件的特殊性,与有计划事件报道流程的差异主要是基本没有准备阶段,进行阶段和结束阶段基本相同。突发事件报道流程示意图,如图2 所示。 需要特殊说明的是,突发事件报道流程中,最开始发布事件时,由于时间紧迫,缺乏事先的准备,只有对事件本身的简单描述,报道组织相关的数据,例如报道需要的人力物力、报道安排等都十分缺乏设置完全没有。这些缺少的数据需要在进行阶段不断更新,甚至到结束阶段视情况进行后期补充。 事件元数据定义了事件元数据指描述新闻事件本身的客观元数据。一个事件的描述信息,包括一个通用的属性集和一些特定于事件的属性,并且这些属性通过一个完整结构来包装。通用的属性集包括了事件的名称、定义、标注以及事件与其他某个事件或者某个话题的关系。特定属性包括了时间、发生状态、访问状态信息、加入条件信息、主题信息、地点信息、参与者信息、组织者信息、联系信息、语言信息、其他信息等内容。报道元数据是指新闻事件报道之前或过程中产生的管理元数据。报道元数据应包含了报员、事件报道中需要使用的各种设备信息、报道任务等、以及提供者根据自己的需要利用自定义结构和元数据来提供额外的非标准信息。 REML 标准的研制工作从2012 年6 月正式启动,经过近10 个月的调研、分析、起草、验证和修改过程,于2013 年3 月基本定稿,并完成标准文本。后经公开意见征集,收集了众多新闻行业内外专家学者和企业技术工作者的反馈意见,并依此对标准文本进行了大规模增补修订,最终于2017 年完成全部国标送审和报批工作,于2017 年12 月底由国家标准委正式发布为国家标准。 标准的起草单位包括新华通讯社、大学、中科大洋科技发展股份有限公司、新奥特()视频技术有限公司、人民日、日报报业集团、解放军、北大方正电子有限公司和中国传媒大学等来自学术界、、科技企业等多个领域的顶尖单位,起草人也囊括了领域专家、学者教授、计算机技术专家以及众多一线工作者,确保了标准的研制过程既有理论高度,又切合行业实际情况。 标准的研制过程包括了需求收集分析、标准设计和起草、公开征求意见和修改以及应用测试等几个阶段。在需求收集分析阶段,标准起草小组广泛调研了当前国内外相关的标准规范,收集了国内新闻领域的各种需求。在相关标准方面,IPTC 国际标准组织发布的NewsML-G2 中包含的EventsML-G2 是相关性最大的工作;国内的国家标准GB/T 20092-2013 中文新闻信息置言(CNML)则是中文新闻信息标准领域最权威的技术标准之一。这两项标准为REML 标准的研制工作提供了良好的基础和参考依据。 (1)事件导向的新闻采编、管理流程,以及REML标准在上述流程中的地位和应用模式等。这方面的需求从根本上决定了REML 标准的服务对象,业务模型和数据模型等各个方面。 (2)元数据模型的需求。从EventsML-G2 标准的内容来看,IPTC 标准组已经将事件导向的新闻工作流程中的各种可能都已经考虑的比较周全,但是在各种细节上,由于国情和语言、工作习惯上的差异可能会导致其元数据模型与实际应用需求间的各种差异。因此,有必要针对我国中文新闻下的特殊情况,考虑对其元数据模型进行必要的增补和修改。 (3)与CNML 标准的配合。CNML 标准已经成为中文新闻信息领域的国标,且已经获得了业内大多数单位和企业的采纳。REML 标准的制定必须要紧密围绕CNML标准,利用好CNML 标准现有的各种有利条件。从需求收集的结果来看,新需求主要集中在对报道管理系统的支持上。与EventsML-G2 相比,REML 标准既包括了面向新闻用户的事件数据表示和应用,还兼顾了新闻生产者以事件为中心的全新新闻报道管理流程和规范。 依据上述需求,标准起草小组融合置言、语义网等技术, 吸收EventsML-G2 和CNML 标准的优点,完成了REML 标准的初步起草工作。起草稿既了与EventsML-G2 和CNML 标准的兼容性,又补充扩展了面向国内新闻行业专业需求的元数据和业务模型。 在之后的两年多时间里,标准研制小组一边征集各方专家对REML 标准的和意见,一边也积极与技术公司合作,将REML 标准应用于实际新闻行业应用系统的开发中,通过实际的软件开发和使用获取更直接和更真实的反馈意见。通过对这些专家意见和应用测试反馈的仔细分析研判,标准起草小组对REML 标准内容进行了持续不断地升级修改,期间历经近十个版本的迭代,最终形成相对稳定且实用的标准版本。 REML 标准的研制过程其实是一次技术创新和思维方式的过程,才能标准在本领域中处于领先地位,并且在相当一段时间内仍然保持其生命力和应用价值。REML 的技术优势主要体现在如下几个方面:首先,REML 标准的数据模型涵盖了新闻事件和报道的策划、生产、交换和管理等新闻事件数据的全生命周期,是一套完整的新闻事件信息数据解决方案。这点可以新闻事件数据在多个技术系统间实现流转,而并不需要转换,大大降低了数据使用和管理的成本,也降低了相关系统的开发难度。其次,REML 标准与现有中文新闻信息国家标准(例如中文新闻信息置言,CNML)之间有良好的兼容性,对已经采用了CNML 标准的单位、系统来说都不存在任何性技术风险。 再次,REML 标准采用了面向知识的语义技术,不仅可以描述新闻事件数据本身,还可以与外部知识库进行关联,进而实现新闻事件数据的语义化分析处理,甚至以此为基础建立新闻事件知识库。 REML 标准的研发过程采用了更先进的“研制- 应用”双线螺旋式推进模式。该模式的优势显而易见,标准在研制过程中就充分考虑了实际应用的需要,并且通过实际应用对标准进行充分的验证和修正,避免了标准高高在上,与实际应用脱节的问题。 随着融服务、知识服务和智能服务的概念在新闻领域逐渐兴起和发展,新闻生产和利用逐渐向数据融合、知识融合的方向快速前进。新闻事件数据作为行业中最重要的知识和资产之一,必将成为各新闻单位关注的重点。而REML 标准的颁布实施,则从标准层面了新闻事件从生产端开始就是以高质量结构化的形式保存,并且能够有效交换和传输,最后还能以语义数据的形式成为知识资产,为构建基于新闻事件知识的智能服务提供基础。 (张鹏,大学计算机科学与技术系知识工程研究室资深工程师,数据科学研究院科技大数据研究中心研究员,研究领域包括文本数据挖掘和语义分析、知识图谱构建和应用等)
|