数据知识产权保护在心理学暗数据应用领域的案例分享
浙江连信科技有限公司联合创始人、副总裁
张无忌
尊敬的各位领导、各位嘉宾,大家好。首先,我要对国家知识产权局表示衷心的感谢,感谢你们提供这样一个宝贵的机会,使我能够参与此次盛会。数据知识产权保护是一个相对较新的议题,在知识产权保护领域中占有重要地位。今天,我将就我们应用心理学在数据生产与维护方面的实践经验,向各位做一个详细的汇报。
一、什么是暗数据
对于暗数据这一概念,公众是否有所了解?实际上,许多朋友向我表达过他们的看法,认为暗数据可能包含不良数据,或者涉及隐私信息,甚至可能是通过不正当或非法手段获取的个人数据。然而,这些理解并不准确。所谓暗数据,指的是在组织的日常运作过程中所收集、购买以及存储于各种系统或数据库内的非结构化或半结构化数据。这些数据常常被忽略,未被利用、分析,甚至未曾被访问过。它们与宇宙中的暗物质和暗能量相似,虽然不可见,却极为关键。这些数据潜藏在组织的数字领域中,等待被发掘。特别是在大规模模型出现之前,我们经常讨论数字化改革和信息化升级,许多业务部门的数据积累在信息系统中,却不知如何应用。这些数据正是我们所说的暗数据。
第一,这些暗数据有特征:首先,传统数据主要以文本形式存在于系统文档、邮件和日志中。这些数据的利用效率通常较低,挖掘其潜在价值颇具挑战。其次,非传统数据包括未标记的音频、视频以及静态图像和声音等,这些数据无法通过传统分析技术处理,需要借助当前的人工智能技术或计算机视觉领域的应用技术进行分析和应用。第三类数据是深度网络中的数据,这些信息往往不被搜索引擎所覆盖,属于私有数据。正如先前嘉宾所提及,我们公司专注于垂直数据应用领域。这些数据主要由政府或私人机构掌握,如医疗记录、法律记录、财务信息以及特定组织的数据库。如何合规合法地应用这些数据,将其加工成数据产品,以促进企业发展,正是我今天想要与各位分享的经验。暗数据已被证实具有极高的价值,它能够保存那些无法通过其他格式获取的重要信息。
第二,人的心理学相关的数据,它属于一类隐性数据。在此,我需要对一个相关概念进行更新。通常,当人们提及心理学时,往往联想到心理健康、医疗或精神病学。然而,心理学的范畴远不止于此。它还包括一个学科分支,即行为科学,该学科本质上是对人类行为倾向的研究,从而揭示其心理特征。我们所从事的正是对这类人的心理数据的收集工作。此类数据具有多种特性,总体而言,它们表现出高度的多样性、主观性,并且在客观运作方面也有所依赖。它们的收集方式因不同场景而异,因此其结构呈现出多元化和异构的形态。
这类数据还具有推断性,意味着我们不能直接通过观察到的信息数据来作出判断,而需要通过推理过程来评估相关的内在心理指标。由于这些特性,心理学相关的数据实际上是一类典型的隐性数据。如何有效地应用这些数据,并在合规合法的前提下进行商业化运作,正是连信正在努力实现的目标。
第三,人的心理学暗数据,它逐渐成为全球科技竞争中关键的数据要素,因为对人类内在心理的研究能够赋予基础能力,有效地对当前多种场景产业进行升级。据我们估算,这一市场潜力可达万亿规模,成为我们下一阶段关注的应用场景。
在这一过程中,特别是在去年我们首次进行数据知识产权保护登记之前,企业在处理数据时感到些许不安。我们所掌握的大量数据,至今已累积至8000万针对个人的样本数据,这些数据极为私密。同时,心理学研究要求高度的伦理标准和数据安全,因此如何将这些数据转化为商业化产品,在进行知识产权登记之前,我们一直在探索如何确保合规合法。我们研究的领域包括数据资源的所有权归属问题。
二、连信暗数据应用的知识产权保护案例
关于数据加工的使用权归属问题,以及如何将数据转化为相应的大模型产品和垂直数据产品,并进行商业化运营,这是数据知识产权保护赋予我们公司的相关能力。下图展示了我公司处理和加工数据资源的流程,它阐释了我们如何将多元异构、海量的大数据,从各种渠道获得的世界和人类数据,通过我们的数据处理引擎,转化为以人类为中心的标准数据库。当我们了解了人类的特征后,结合与业务相关的外部动态数据以及业务场景和客户需求,我们便能够为业务应用伙伴提供相应的输出。
以浙江司法矫正为例,通过我们对数据的深入加工与分析,成功降低了57%的再犯率。关键在于利用人工智能技术,我们能够识别出哪些个体存在再犯风险,并采取相应的预防措施进行早期矫正。通过这种方式,我们有效预防了风险,进而减少了整体犯罪率。此外,我们在18个省份推广了针对校园心理安全的监控系统。通过分析教室、走廊、食堂及校门口等公共区域的视频监控数据,我们能够持续评估学生的心理健康状况,从而预防极端行为的发生。这体现了我们在数据处理方面的能力。这套能力的核心是“洞见人和大模型的应用”,该大模型已于去年四月通过国家备案,成为全国首个应用于心理领域的大型模型。
凭借这一能力,我们能够在多个行业领域推广相关应用,包括国家安全、社会治理、个人发展、身心健康以及产业互联等。每一个应用领域都代表了我们的数据产品和数据资产,我们致力于将这些应用转化为数据知识产权的保护。
今日,我们在数据资产保护领域取得了重要进展,完成了针对医疗领域及社会治理司法场景的数据知识产权登记工作。在此,我将就我们近期获得的医疗健康病症筛查数据知识产权进行简要汇报。在这一特定场景中,我们处理了多种类型的数据样本,这些样本涉及具有精神健康问题的患者,包括门诊病历、生活及门诊过程中的视频、音频、文本记录、档案记录,以及相关的对话和生理信号采集记录。
我们以合规的方式采集了这些数据,并成功地将其注册为数据知识产权。基于这些数据,我们研发了一款无感检测心理异常和心理病症倾向的分析产品,并已在浙江省大数据交易中心上架,作为数据产品对外进行商业应用。
在数据知识产权应用领域,我们采取了一系列行动,这些行动对本公司具有显著价值。首先,我们对数据资产进行了评估并将其纳入财务报表。在2024年6月,我们委托第三方对我们的大型模型进行了单项数据资产评估,结果显示该数据资产价值高达3.65亿元人民币,创下当时全国单项数据资产评估的最高纪录。
其次,关于本次案例的数据知识产权登记,我们成功获得了银行提供的5000万元信用融资支持,这对公司的发展起到了积极的推动作用。
第三,我们将相关产品提交至大数据交易中心进行挂牌交易。此类案例不仅有助于推广公司品牌,而且通过这些操作,我们确保了公司对大数据,尤其是涉及伦理和隐私的数据,进行了合规合法的保护。这使得公司能够以更合适的方式进行商业化应用,从而为公司带来了更大的帮助。
三、关于连信
连信坐落于浙江杭州,此地乃六小龙之故乡。我们自视为心理行业中的Palantir。Palantir是一家美国公司,市值达万亿美元。该公司所从事的业务,例如,他们协助美军通过大数据分析和人工智能技术成功定位并抓捕了本·拉登。我们同样致力于此类工作,但我们的重点更多在于对个体的深入分析,并据此开发相关应用。
我们研究的核心在于人类行为,且在该领域取得了众多行业首创的成就。例如,在2018年,我们推出了国内首款心理应用AI机器人。在武汉疫情暴发初期,我们是首批提供AI心理支持的企业之一。我们也是将心理学与社会治理相结合,并以Al技术为辅助的科技企业先锋。此前,心理学的应用多集中于健康领域,而我们则开创性地推出了首个将人与业务融合的能力开放平台。
我们的核心技术和应用产品已达到世界领先水平。在此,我将简要介绍我们的基础和核心能力。我们领先于全国的技术包括多模态情绪识别、高危行为预测、无感化心理疾病筛查以及仅通过摄像头识别生命体征的能力。
在世界领先的大模型PK方面,我们的人物综合分析能力处于顶尖水平。即使在信息线索较少的情况下,我们也能对个体进行更为科学和准确的心理特征评估。这包括我们的多模态人格识别技术和中国人的心理样本库。
凭借这些能力,我们开发了众多应用,涵盖了开放平台、个体分析预测系统以及针对不同场景的应用,如无感评估、学校、社会治理、政法委、公安等领域的谈话助手,面向个体、企业面试招聘、组织管理、政工谈话的审讯助手,以及公安纪委等特殊场景的审讯助手,还有与生命体征相关的应用。此处仅展示了部分成果。
我坚信,在任何有人类活动的领域,我们的应用都发挥着作用。无论是国家安全、社会治理,还是民生健康、产业发展,乃至个人成长,通过大型模型的应用,我们都能实现相关领域的服务。今天的分享到此结束,感谢各位的聆听。
扫一扫在手机上查看当前页面


网站地图