党的二十届三中全会指出,“健全促进实体经济和数字经济深度融合制度。”“加快构建促进数字经济发展体制机制,完善促进数字产业化和产业数字化政策体系。”为深入贯彻党的二十大和二十届二中、三中全会精神,加强市场监管基础理论、基础制度、基础建设研究,推动市场监管更好服务经济社会发展,8月中旬,市场监管总局发展研究中心启动了2024年度重大项目《自动驾驶与数据治理交叉研究》相关工作,在京举办了自动驾驶与数据治理交叉研究讨论。
来自公安部道路交通安全研究中心、中国电工技术学会、中国政法大学、北京理工大学、东南大学、对外经贸大学、上海财经大学、深圳大学、北京建筑大学、北京经开区城市运行局、北京市高级别自动驾驶办公室、北京汽车研究总院、百度、小马智行、小米汽车等科研机构、政府部门、社会团体和企业代表近30人参加会议。与会专家围绕自动驾驶场景下的数据治理问题、在自动驾驶场景下当前数据治理的最新进展和治理诉求、自动驾驶与数据治理交叉研究的困境和难题、自动驾驶场景下数据治理的意见和建议进行深入热烈的研讨。
2024年5月21日,在北京城市副中心,一辆无人驾驶小巴在运行中。新华社记者 鞠焕宗 摄
一、统一数据标准,促进数据共享
《工业和信息化部办公厅关于印发车联网网络安全和数据安全标准体系建设指南的通知》鼓励国内企事业单位积极参与车联网网络安全、数据安全国际标准化活动,积极贡献中国的技术方案和实践经验。《工业和信息化部关于加强车联网网络安全和数据安全工作的通知》鼓励各相关企业、社会团体制定高于国家标准或行业标准相关技术要求的企业标准、团体标准。
数据标准不统一是数据治理的首要难题。北京汽车研究总院有限公司智能网联中心副主任陈新认为,数据治理方面的最大问题在于车厂各做各的系统,有很多重复数据的采集,并且没有国家层面的统一标准的制定。建议政府部门联合主流头部车企或者人工智能公司推出相应的标准、接口,统一建设国家级数据中心、超算中心。北京建筑大学交通工程系教授、北京经开区城市运行局挂职副局长林建新认为,建议出台更先进的标准。对外经贸大学数字经济与法律创新研究中心主任许可认为,数据标准、数据接口、数据格式不统一,不同的公司、不同传感器、不同主体的程序和方式获得的数据很难交互使用。这些数据的不可用,无法复用的情况非常突出,怎么通过由上自下标准的制定来形成标准统一,这对于数据流通至关重要。
统一数据标准成为与会专家一致共识。原国家质检总局执法督查司司长严冯敏认为,应按照有效市场与有为政府结合的原则,发挥行业标准、团体标准等作用,尤其在政府主导制定国家标准之前应发挥市场的作用,通过制定并实施团体标准推动落实数据确权的治理理念和责任划分,不断完善数据治理规则和健全数据治理机制。中国政法大学副校长、数据法治研究院院长时建中提出,促进自动驾驶可以从完善数据标准、技术标准入手,从点到面,试点先行,通过市场化的路径和政府的引导支持规范实现全国一体化。还要鼓励企业标准,鼓励团体标准,鼓励地方标准慢慢再推动全国标准,这是渐进的过程。中国电工技术学会电动车专委会副主委窦刚希望国家部委层面上给予指导,明确标准。
统一数据标准有利于减轻企业交易成本。小马智行政府事务副总裁王彊、法律合规总监刘沁华认为,随着智慧城市的建设、路端设备的增加,数据可能更多集中在政府侧,企业的诉求在于能不能把某些路端数据作为公共数据进行确权和管理。希望能够制定一套统一的数据接口标准,以实现与路端设备及自动驾驶交通工具之间的顺畅数据交换和通信。同时,确立确权机制,确保各方在使用数据时的权益得到合理保障和明确界定。小米汽车法务经理秦淑娟认为,当前数据的共享和流通上还存在限制,希望后续相关主管部门在推动自动驾驶发展过程中,有更多的安全沙盒监管场景,各个部门在发挥自己职责的过程中,多做一些衔接和统一,能够给予企业更多数据共享和流通的场景以及方向,确保企业上传数据不会因为接口的不同、格式的不同、范围的不同,增加企业更多的负担和压力。
统一数据标准的目的是促进数据共享。深圳大学创新发展法治研究院院长叶卫平分享了数据共享的国外经验:2021年德国自动驾驶法明确规定车辆保有人对特定智能汽车数据负有的存储义务,并且承担将上述智能汽车数据共享给智能汽车运输主管部门的义务。东南大学交通学院副教授俞灏认为,数据共享的困境主要有三个方面的问题:一是基本规则缺失,包括数据的所有权、数据分享范围及对象、授权规则。二是激励机制缺失,存在行业垄断的问题,科研机构很难有激励机制从车企得到数据来源。三是数据安全风险隐患,安全风险包括了国家安全、运行安全、个人隐私,大数据时代数据安全不同于传统数据安全。上海财经大学商学院产业经济系主任居恒认为,在数据收集、清理或标准化的过程中,要实现在不同的类型、不同的过程中涉及到不同的机构数据的互联互通,是否需要独特的政策工具,如何在不影响竞争的情况下去设计实现这样一个交换机制,包括必要的定价。北京理工大学副教授、新能源汽车国家大数据联盟副秘书长刘鹏建议政府出台一些具有实操性的政策,明确不同数据源在不同应用领域的开放共享模式,除了车本身数据之外的其他数据,也需要明确在共享和共用过程当中应以什么形式共享和共用。
二、严格安全底线,促进产业发展
《国务院办公厅关于印发新能源汽车产业发展规划(2021—2035年)的通知》指出,我国新能源汽车产业发展取得了巨大成就。到2025年,高度自动驾驶汽车将实现限定区域和特定场景商业化应用,充换电服务便利性显著提高。2023年11月,工业和信息化部、公安部、住房和城乡建设部、交通运输部联合发布《关于开展智能网联汽车准入和上路通行试点工作的通知》,引入安全监测和报告、安全事件、交通违法事故上报等机制,要求汽车企业、试点使用主体、地方政府、公安部、工信部等建立安全监管平台。
北京成功申报全域领域国家人工智能创新应用的先导区,将促进智能网联数据在京聚集,促进数字经济蓬勃发展。北京市高级别自动驾驶示范区将多源多模态的数据整合为统一的数据视图,建立了安全管理办法、管理细则、实践指南三级数据安全治理政策体系,构建了事先防范、事中实时监控和数据共享全流程的数据安全技术保障,为促进数据要素流通、实现数据价值挖掘积累了丰富的实践经验。
林建新对比了我国和美国在自动驾驶数据治理上的现状。叶卫平从制度供给视角分析了我国汽车数据安全现状,一类是通用性立法,需要关注开放共享、专门委员会、数据合规、第三人查阅数字权等能否落地;另一类是标准立法,例如《汽车数据安全管理若干规定》属于专门立法。居恒认为,围绕自动驾驶数据的问题,需要类型化一些概念体系和基础知识,按照技术与商业实践特性明确数据类型,比如训练用的数据,还是实时的数据,还是一些地图、充电桩静态的数据,还有一些用户层面的敏感数据。时建中建议,我国自动驾驶与数据治理的交叉研究上仍需深入基础研究,例如研究数据分类;还要解构场景化的自动驾驶,区分不同场景和线路。专家们一致认为,在自动驾驶数据治理上,相关部门应尽快提供中国方案。
发展与安全的关系是讨论的焦点。时建中认为,治理的目的在于促进发展,要以数据治理为手段,以安全和发展为目标,促进算法算力合作。陈新主张,目前的技术路线强依赖于人工智能,对数据的依赖度越来越紧密,算法也在不断地提升,怎么能拿到数据,怎么能把数据的安全性保障,是现在的企业都会面对的问题。秦淑娟认为,自动驾驶会产生很多车辆的位置信息和传感器相关的数据,这对用户来说是非常敏感的。这些数据在企业内部的后台怎么做安全管理,以及可能要发给不同的主管机关和不同的平台,外发的过程中怎么管理可能是后面比较大的一个挑战。许可建议把数据的安全问题、重要数据的界定问题做得更清楚,把个人信息保护问题做得更明确。严冯敏主张,要实现自动驾驶汽车规模化和商业化落地,必须要确保数据安全。一是坚持发展和治理并重;二是完善数据安全的治理规则,完善算法推荐服务的规制,关注汽车交易市场的信息不对称问题;三是坚持应用数字技术来管理网络、治理数据。
如何进行定责是应该提前考虑的事情。人机发生事故以后,尤其是自动驾驶,责任怎么认定?俞灏认为,可以从数据的来源,数据的类型、精度、应用场景还有不同使用主体等,从技术角度价值进行衡量数据的技术价值。秦淑娟希望后续相关监管部门对企业采集的数据经过匿名化处理后的数据资产确权问题,作进一步明晰。许可从概念上辨析了去标识化和匿名化,并提出每个人共同生产数据,各方对于自己持有的部分都享有完整的权利,可以持有、可以使用、可以经营,但不能影响其他方,从理论上解决各方充分参与形成数据权益的界分问题。时建中建议,鼓励通过保险的方式实现责任分配分担的社会化。
三、完善综合治理,规范市场竞争
《国务院反垄断委员会关于汽车业的反垄断指南》指出,公平竞争是发挥市场配置资源的决定性作用、促进汽车业健康发展、维护消费者利益和社会公共利益的重要保障。《国务院办公厅转发国家发展改革委、国家能源局关于促进新时代新能源高质量发展实施方案的通知》要求,规范新能源产业发展秩序,遏制低水平项目盲目发展,及时纠正违反公平竞争的做法,破除地方保护主义,优化新能源企业兼并重组市场环境和审批流程。
规范自动驾驶市场既要鼓励创新,又要促进合规。时建中认为,自动驾驶市场不可能成为一个竞争性的市场,实际上有高的退出门槛注定了进入门槛也是很高的。这就需要合理运用反垄断法关于垄断协议豁免的条款,尤其在研发合作、算力合作等领域。居恒认为,未来不管是L4还是L5级别的自动驾驶实现,很可能会使市场趋向于高度集中。叶卫平从政府与市场的关系展开分析,从权属特征基本上可以把数据分成两种类型:一种是属于私人物品,还有一种公共数据,就是车外环境相关的信息,它有公共属性。对于不同类型数据,本来要求不一样,供给也还不一样。对于私人物品,可以与《个人信息保护法》进行对接。许可认为,在数据流转的过程中公共数据汇聚可能涉及行政垄断和不公平竞争的问题,建议政府纠正一些地方违反公平竞争的做法,更多地帮助各个数据厂商实现更有效数据的流通和应用,在此背景下做好数据的安全工作。
规范自动驾驶市场既要尊重技术规律,又要做好政策引领。林建新提出,当前算力和成本不成正比,可能买了很多芯片,但算力问题仍然没有解决。算法在不同场景、环境上的适用性比较差,存在识别误差和误判;缺乏算法透明度和决策的可解释性,影响公共信任度;在整个算法治理过程中对伦理和道德因素考虑不够,缺乏伦理的要求。北京市高级别自动驾驶办公室高凤飞提出了数据治理的突出问题,第一,数据量非常大,包括车端的、路侧的、第三方的数据,对于数据隐私和安全保证的要求非常高。第二,数据质量的标准不一样,例如车端数据和路侧数据的时空一致性需要很大的治理成本。第三就是数据存储、处理、管理的技术和管理能力要求高、成本昂贵。建议完善政策和数据治理标准,规范和加强数据资产的管理;考虑数据的合规和监管,确保数据来源的合法、隐私保护到位、流通和交易规范;加速前沿技术在数据治理中的应用和创新引领,支撑数据价值的安全、高效地释放。刘沁华从企业数据生命周期的管理视角,认为在面临大规模的数据增长的情况下,怎样更好地做到数据清洗,与技术、法律还有其他团队做更好的融合,进一步提升数据的质量,是现在面临的挑战。
“综合治理+分类分级”是比较好的切入点。严冯敏主张,提高治理效果需要实行综合治理,需要持续完善治理规则,需要应用数字化手段来推进。时建中认为,在自动驾驶场景下数据治理的原则应是“综合治理+分类分级”,防止碎片化分类分级和无人治理。治理数据必须要用技术来治理,不能仅仅是靠法律,也不能仅仅靠制度,它一定是“制度+技术+伦理”,这三个缺一不可。刘鹏认为,企业治理应该是有一个需求的牵引。现阶段对于数据的治理和应用核心在三个方面:第一个是“能用”的问题,从法规和政策层面,明确流程来解决;第二个是“好用”的问题,从数据治理技术角度,提升质量来解决;第三个是“敢用”的问题”,需要从安全规范和技术角度,分类管理来解决。刘沁华认为,在数据治理领域数据分类分级是比较切实的切入点。
近期,市场监管总局发展研究中心公开征集《自动驾驶与数据治理交叉研究》项目。下一步,中心将与各界研究机构一起,加强自动驾驶与数据治理交叉研究,为自动驾驶与数据治理交叉领域立法、执法实践贡献智慧。(国家市场监督管理总局发展研究中心 卢雁、孟书宏、韩东)