SERVICE PHONE
13988889999发布时间:2025-12-30 22:55:39 点击量:
哈希游戏,哈希游戏官网,哈希游戏平台,哈希娱乐/哈希游戏作为一种新兴的区块链应用,它巧妙地结合了加密技术与娱乐,为玩家提供了全新的体验。BET哈希平台台凭借其独特的彩票玩法和创新的哈希算法,公平公正-方便快捷!哈希游戏官网,哈希游戏平台,哈希娱乐,哈希游戏
该数据要素案例由亚信科技投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的
在数字经济成为经济增长核心引擎、数据要素上升为国家战略资源的时代背景下,公共数据的开发利用成为激活数据要素价值、推动经济社会数字化转型的关键抓手。中央办公厅、国务院办公厅印发的《关于加快公共数据资源开发利用的意见》,明确提出要推动公共数据“供得出、流得动、用得好”,为公共数据资源开发利用工作指出了方向。上海市大数据中心作为统筹全市公共数据管理、运营与共享的核心枢纽,肩负着落实国家政策要求、释放公共数据社会化价值的重要使命,其公共数据授权运营工作更是打通数据要素流通“最后一公里”的关键环节。
当前,公共数据授权运营实践中,数据“可用不可见”的核心开发原则与数据要素高效流通的需求存在现实矛盾:一方面,公共数据涵盖政务服务、城市治理、民生保障等多领域核心信息,数据敏感性高,需严格遵循《数据安全法》等法律法规,隐私保护与安全合规要求不可逾越;另一方面,传统数据供给模式存在审批流程繁琐、数据格式不统一、“数据孤岛”林立等问题,导致数据要素供给效率难以匹配社会主体对公共数据的多元需求,制约了公共数据社会化价值的充分释放。
为响应相关需求、落实国家政策精神,破解公共数据授权运营中的数据流通难题,上海市大数据中心亟需通过技术创新构建安全高效的数据要素流通体系。在此背景下,上海市大数据中心与亚信科技达成深度合作,启动“数据合成技术促进公共数据社会化价值释放”项目。项目采用行业先进的“数据+人工智能”应用模式,参照相关规范,以差分隐私与生成对抗网络融合的生成式AI技术为核心,构建覆盖数据全生命周期的合成管理体系,通过模拟数据提前供给、简化授权审批流程,实现数据要素价值释放与隐私安全防护的动态平衡,助力公共数据在合规前提下向社会各界有序流通,为医疗、金融等敏感领域提供安全数据支撑,推动公共数据开放与企业数据流通双轨并行,构建驱动城市数字化转型的战略性基础设施。
本次合作的项目案例中,客户提出的“数据要素”类需求主要集中在合规、高效、高质量、场景灵活适配四个方面:
·合规流通需求:严格遵循《关于加快公共数据资源开发利用的意见》《数据安全法》等政策规范,落实公共数据授权运营“可用不可见”原则,在保障自然人、法人敏感信息安全的前提下,实现公共数据合规供给,破解“数据孤岛”问题,满足“供得出、流得动、用得好”的核心诉求。
·高效供给需求:针对公共数据类型复杂、格式多样的特点,需构建高效的数据要素供给体系,简化授权审批流程,通过提前供给模拟数据支撑开发利用方产品研发,提升数据要素流通效率,匹配金融、民生、消费等领域的多元需求。
·高质量保障需求:要求合成数据在分布规律、统计特性上与原始数据高度一致,确保字段完整度、跨表关联一致性,同时具备精准的关联性挖掘能力,满足业务决策、联合分析、模型训练等场景对数据可用性、完整性的要求。
·场景适配需求:需适配通用数据探查与复杂场景业务探查等不同场景,既支持批量样本快速生成,也能通过定制化算法满足复杂业务逻辑下的精细化数据需求,实现多元场景下的数据要素精准供给。
作为数字经济时代的一员,亚信科技同样认识到数据要素价值释放的关键在于实现“安全与效率的动态平衡”——既要通过流通共享激活价值,又要通过合规管控防范风险。基于这一认知,亚信科技针对性地推出数据合成技术解决方案:
·构建“质量-安全”双维防护体系,研发覆盖样本抽取、数据合成、关联处理、合规审计的全生命周期管理机制,通过分层抽样、生成对抗网络与差分隐私融合技术,保障合成数据与原始数据特征高度相似,同时规避敏感信息泄露风险。
·设计场景化与通用型双轨支撑模式:“场景化”模式适配复杂业务探查需求,“一事一议”优化算法,支持11项核心指标;“通用型”模式满足基础数据需求,批量生成效率高,覆盖8项关键指标,兼顾精细化与供给效率。
·搭建协同增效规范体系,制定《合成数据使用指南》,明确多方责任主体闭环链路,建立需求支撑规范与质量评估标准,实现数据要素供给的标准化、规范化,通过技术创新与流程优化,全面支撑公共数据社会化价值释放。
公共数据作为关键数据要素,需严格遵循“可用不可见”原则及《数据安全法》等政策要求,合规安全与价值释放的平衡难度突出。一方面,原始数据敏感信息密集,直接流通将导致隐私泄露,需通过技术手段实现脱敏保护;另一方面,过度管控又可能导致数据要素价值流失,如何确保合成数据既符合安全合规要求,又与原始数据在分布规律、统计特性上高度一致,成为一大难题。
数据要素“供得出、流得动”的核心诉求与现有供给能力存在显著差距。效率层面,传统授权审批流程繁琐,服务器算力限制导致数据吞吐能力不足,通用型和定制型多种场景需求进一步加剧了生成效率挑战;质量层面,数据要素存在特征覆盖不全、样本分布与实际数据偏差、外键关联不足等问题,导致合成数据缺乏统一评判依据,通用版本易出现质量偏差,难以满足联合分析、模型训练对数据要素完整性、关联性的高要求。
数据要素需求多元化与场景化特征明显,但缺乏完善的适配与管理体系。需求方业务逻辑、探查规则差异大,且部分需求缺乏清晰标准,导致需求拆解难、交付质量参差不齐;同时,公共数据授权运营覆盖金融、民生等10多个领域,既有复杂场景的精细化探查需求,也有通用场景的批量供给需求,由于场景适配能力不足,现有模式难以兼顾,导致数据要素供给与实际需求脱节。
数据要素价值释放需要需求方、数据治理部、合成团队、安全专家组等多方协同,但彼时的协同机制存在不足,缺乏统一的需求支撑规范与分类分级处理机制,难以实现规模化数据要素供给。同时,数据业务验证缺乏有效支撑,合成数据的业务适配性难以精准校验,制约了数据要素全生命周期管理的规范化与高效化。
本次项目案例聚焦于上海市大数据中心公共数据授权运营场景,数据处理覆盖多领域公共数据,形成了标准化、全流程的处理体系。
数据类型:包括但不限于:政务服务数据、城市治理数据、民生保障数据、经济发展数据等。
本项目处理的数据均来源于上海市大数据中心统筹管理的合规数据源,需经权限申请审批后获取。截止目前已完成数十个授权运营重点场景的数百张表数据处理,其中通用型合成数据每周处理能力达50张表,高质量场景定制型合成数据每周处理30张表,涵盖多领域核心业务数据及多表外键关联数据、字段相关性数据,形成了体系化的数据要素处理基础,为数据合成及合规流通筑牢数据根基。
数据处理过程中,严格遵循“安全合规、精准抽取、关联有效”原则,针对不同领域数据的特征,采用分层抽样、业务关系提取、敏感字段专项处理等标准化流程,在保障数据要素安全的前提下,确保抽取的样本数据与原始数据分布特征高度一致,为后续合成数据生成、数据要素合规流通提供高质量的数据基础,充分挖掘公共数据中蕴含的数据要素价值。
在上海市大数据中心引入数据合成技术促进公共数据社会化价值释放的项目中,通过组建专项工作组攻关技术难题,实现了对公共数据探查、产品开发测试、模型训练语料供给等需求的支撑。在授权运营场景下,提升了数据可用性与安全性,提高了数据开发、分析效率,满足了敏感数据研究需求,真正实现了公共数据资源的互联互通和社会化价值释放。
基于数据安全管理要求,结合数据合成生成技术,项目从管理、技术、运营三方面构建了数据合成生成能力体系。
3)安全管理:涵盖安全检测、重点识别风险评估、访问权限控制、使用审计等,纳入安全管理体系。
2)基于AI算法合成:利用机器学习、深度学习、大模型等技术进行数据合成。
4)质量及安全控制:验证数据合成质量,确保符合特征分布;实现权限管理、风险主动识别。
本次项目围绕“促进公共数据社会化价值释放”核心目标,用到的主要数字技术为数据合成技术。数据合成技术是指利用先进的人工智能与机器学习技术,在严格保护原始数据隐私与安全的前提下,依据内在的统计规律、分布特征与复杂关联,生成一批“形异神同”的合成数据集,助力数据要素价值探索和流通交易。
通过构建数据合成技术三大核心支柱,生成对抗网络算法进行模型学习,融合了差分隐私技术保障数据绝对安全、不可逆推,并统计逻辑保持来锁定业务逻辑合理。
在统计数据中主动加入精心计算的数学“噪声”(随机干扰)。这个“噪声”的量是经过严格计算的,它足以掩盖任何单个个体的信息,但又不会破坏整体群体的统计规律
不仅仅解决单列数据的分布(如年龄分布),更学习多列数据之间的高维相关性。它构建了一个多维的概率分布模型。当生成数据时,它会严格遵守这些依赖关系
一个生成器负责制造伪数据,一个判别器负责识别哪个是真数据,哪个是假数据,两者不断博弈经过数万轮的训练达到了“以假乱真”的效果。
1)样本数据抽取算法:基于数据要素的业务域特征与分布密度,构建多维度分层抽样框架,突破传统单一维度抽样局限。通过引入特征重要性权重,对核心业务字段进行优先级排序,支持按比例抽样、固定样本量抽取、最优信息熵样本抽取三种模式。抽样后采用KS检验、PSI值进行特征一致性校验,确保样本数据与原始数据在核心分布特征、关键统计指标上的高相似度,为后续合成环节提供高质量数据基底,该技术已在政务数据规模化处理场景中验证可行性。
2)数值型字段合成算法:深度融合条件生成对抗网络(CGAN)与差分隐私(DP)技术,构建“分布建模-对抗训练-隐私防护”三级架构。首先通过核密度估计(KDE)、贝叶斯网络对原始数据的分布特征进行精细化建模,精准捕捉数据偏态、长尾等复杂分布规律;随后利用CGAN的生成器与判别器动态对抗训练,优化生成数据的统计特性还原度,使均值、方差、分位数等指标与原始数据偏差;同时嵌入ε-差分隐私机制,通过噪声添加与隐私预算分配,在不牺牲数据可用性的前提下,从数学层面杜绝原始数据反推风险,该算法已达到行业内数值型数据合成的领先精度水平。
3)敏感信息合成算法:遵循《数据安全法》《个人信息保护法》及相关分级防护要求,构建敏感信息动态分级体系(高/中/低三级)。针对不同对象,采用“规则引擎+生成式AI”混合架构,既保障敏感字段的语义一致性,又实现“数据可用不可见”。同时嵌入敏感信息识别与脱敏校验模块,通过NLP实体识别、正则匹配双重校验,确保敏感信息合成合规率达到要求。
4)关联性字段处理算法:融合统计学习与语义理解技术,构建“数据关联挖掘-关联规则建模-生成校验”全链路算法。首先通过互信息计算、皮尔逊相关系数、图神经网络(GNN)挖掘数值型、文本型数据间的潜在关联,构建业务关联知识图谱;随后基于关联规则库,采用注意力机制增强的序列生成模型,确保生成数据的关联逻辑一致性;最后通过关联置信度校验与业务场景适配性验证,保障数据关联的合理性与可用性,为跨领域数据融合分析、业务决策支持提供技术支撑。
5)外键关联字段一致性校验算法:基于分布式事务一致性原理,设计“预校验-生成-后校验”闭环机制。在数据合成前,通过元数据管理系统梳理跨表外键关联关系,构建关联拓扑图;生成过程中,采用两阶段提交(2PC)机制,确保外键关联字段的主键与从属属性同步生成、一致性更新;合成后通过双向哈希校验、跨表关联查询验证等方式,对关联字段的完整性、准确性进行批量校验,外键关联一致性通过率达到90%以上。该算法支持大规模分布式数据表处理,可适配多源异构数据场景,有效解决传统合成数据中跨表关联断裂、属性不一致等痛点,满足业务需求方对数据完整性、可用性的核心要求。
通过一套分层递进的公共数据合成全链路支撑系统架构,从底层算力到上层业务应用形成完整闭环,架构说明如下:
·硬件资源与驱动层:作为底层算力支撑,通过GPU、NPU、CPU等异构计算资源,结合CUDA/CANN驱动提供高效算力,为数据合成全流程提供性能保障;
·多模态数据接入层:承担数据预处理功能,通过多数据接入、数据清洗、数据转换,将多源异构的原始数据标准化为算法可处理的基础数据;
·数据合成算法层:是技术核心层,涵盖样本抽样、主外键处理、特征提取、质量评估、数据合成、数据安全等算法类别,为数据合成提供技术实现能力;
·数据合成运营层:负责平台化运营管理,通过运营平台首页、数据集管理、合成任务监控、模型/算法管理及质量评估,实现数据合成全流程的管控与调度;
·应用支撑层:是业务落地层,支撑公共数据开发利用、数据产品安全流通、高质量语料训练供给、产品开发测试等实际场景,完成数据合成技术向业务价值的转化。
整体架构实现了从算力支撑、数据接入、算法实现到运营管理、业务应用的全链路覆盖,保障公共数据合成的高效、安全与场景适配性。
在项目实施过程中,尤其是到了真正赋能公共数据授权运营环节,为保障合成数据能贴合生产特征,且重要数据不被泄露,我们严格遵循“安全合规、精准抽取、关联有效”原则。即先从生产抽取数据,再对重要数据、隐私数据,以及可逆向工程推断原始数据的信息进行数据合成或脱敏处理,保障合成数据安全合规。
通过分析数据特征,识别外键字段,生成可视化关联图,计算相关系数并展示,据此调整合成算法参数。最终输出关联结果和相关性报告,为数据合成提供科学依据,确保其完整性和逻辑合理性,提升质量和保真度。
在本项目推进过程中,为强化数据合成技术的场景落地能力与产品化输出效率,我们与上海市大数据股份有限公司进行了深度合作。双方基于各自技术、资源优势展开深度协同,共同推动公共数据合成全链路能力的落地与产品化升级。
1)硬件集成与产品孵化支持:针对项目所需的异构算力(GPU/NPU/CPU)与算法集成需求,上海市大数据股份有限公司承担了硬件资源选型、定制化集成工作,将多模态数据接入、数据合成核心算法与CUDA/CANN驱动的算力硬件进行一体化封装,并联合亚信科技共同孵化出“数据合成一体机”产品。该一体机实现了数据处理、算法运行、安全管控的硬件级整合,大幅提升了数据合成能力的部署效率与运行稳定性;
2)数据与场景对接支持:作为深耕上海公共数据领域的专业机构,上海市大数据股份有限公司协助完成了与上海市大数据中心多源公共数据的合规接入对接,同时提供了政务服务、城市治理等领域的实际业务场景需求,帮助项目团队精准匹配算法优化方向,推动合成数据在公共数据授权运营场景中的测试与验证。
双方协作不仅解决了项目中硬件集成、场景落地的关键问题,更通过产品孵化实现了技术能力的复用,为公共数据合成技术的规模化推广构建了生态基础。
项目落地后,上海市大数据中心在数据要素价值释放的效率、安全、降本增效等方面,实现了突破性提升,核心商业价值变化如下:
·数据要素供给效率倍增:项目实施之前的公共数据授权运营中,数据供给周期长、规模有限。项目落地后,通用型合成数据周生成能力达百余张表、高质量定制达80%以上,数据供给效率较传统模式提升5倍以上;累计完成数十个授权运营重点场景的数百张表数据合成支撑,数据要素供给规模扩大数倍,可提前向开发利用方供给模拟数据,将产品研发周期缩短30%。
·数据要素安全流通率达100%:通过融合差分隐私与同态加密的模型创新,生成无真实个人信息的合成数据,破解了公共敏感数据“可用不可见”的流通难题,敏感数据合规流通率提升至80%以上;依托全流程安全护盾机制,数据全链路合规性核验通过率达100%,彻底规避敏感数据泄露风险。
·数据要素能力复用降本提效:将数据使用方操作合规性提升至95%以上,多维度质量防线保障合成数据字段完整度100%、跨表关联一致性达80%;提炼共性功能形成可复用能力后,预计部署至分中心数据中台可降低人力成本40%、提升数据处理效率50%,为数据要素市场化配置提供了可复制的标准化模式。
亚信科技是领先的信息技术产品与服务提供商,依托咨询规划、产品研发、实施交付、系统集成、智慧决策、数据运营等能力,面向政务、通信、能源、交通、金融等行业提供数智化全栈服务,连续多年位列中国软件和信息技术服务竞争力“百强”榜单。亚信科技具备丰富的软硬件产品研发与大型工程实施交付经验,形成了包括人工智能、5G、大数据、云计算等在内的“数智”“云网”“IT”三大产品体系,众多项目被行业组织评为标杆案例。
亚信科技(股票代码是领先的信息科技产品与服务提供商,依托咨询规划、产品研发、实施交付、系统集成、智慧决策、数据运营等能力,助力通信、政务、能源、交通、广电、金融、邮政等领域客户数智化转型!
上海市大数据中心成立于2018年,统筹上海市公共数据集中管理与价值释放。核心职能涵盖公共数据归集整合、治理共享、授权运营及安全管控,构建跨部门数据共享体系与城市数字底座,制定数据管理技术标准与办法。同时支撑城市数字化转型、数智场景规划落地,推动公共数据与社会数据融合应用,通过数据要素高效流通赋能城市治理、经济发展、生产生活数字化,为上海国际数字之都建设提供数据支撑。
★以上由亚信科技投递申报的数据要素案例,最终将会角逐由金猿组委会×数据猿×上海大数据联盟联合推出的《2025中国大数据产业年度数据要素价值释放案例》榜单/奖项。
该榜单最终将于1月上旬上海举办的“2025第八届金猿大数据产业发展论坛——暨AI Infra & Data Agent趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场。
据“温州发布”消息,12月30日,温州市委常委会召开会议,浙江省委常委、温州市委书记张振丰主持会议。上述信息显示,浙江省副省长、温州市委书记张振丰已任浙江省委常委。
12月30日,中国新闻周刊从“马鞍山武校投毒案”被害人家属处获悉,本案两名罪犯付某某、朱某某已于近日被执行死刑。1997年6月30日,安徽省和县南北少林武校发生一起特大投毒案,造成130人中毒7人死亡。
香港违例吸烟罚款提高至3000港元 排队时禁止吸烟,适用对象包括所有游客,罚款前不会事先警告
锁岛!第二天实弹开火!位台岛南北双向出击,查证、驱离、模拟打击一气呵成,打“独”促统说到做到
“全球百大美男”2025年名单出炉,梓渝、田栩宁分別排第28、37位,肖战、王一博分別排第42、52位,香港顶流姜涛从第二降致十二 #梓渝 #田栩宁 #肖战 #王一博 #姜涛
六年前花3.6万元在香港定制的钻戒,现在回收居然只值四五百,“钻石恒久远 一颗永流传”,因为卖不出去砸手里了。#钻戒
百万年薪急招一名高管!在一连接到多起安全指控后,OpenAI终于坐不住了。于是在最近,这家公司豪掷55.5万美元(约合人民币389万元)+股权,原地开招一名安全防范负责人(Head of Preparedness)——其核心职责是,制定并执行OpenAI的安全防范框架。
编辑导语:李丰是峰瑞资本创始合伙人,圈内大家都习惯喊他丰叔,他与商业作家李翔联合主理的播客栏目《高能量》已连载到199期,这档栏目在科技圈/创投圈都获得了广泛的关注和认可。
❏红星新闻时光的钟摆,正荡向2025年的最后刻度。无论你身处何方,心系何事,请接受我们最诚挚的祝福;无论你在沐浴阳光,还是经受风雨,请让我们并肩而立,共写新岁序章。一年里,我们记录时代的巨浪,也倾听个体心跳的微响;我们关注流量汹涌的漩涡,也探寻沉默深处的力量。
高市早苗上台两个月,日本经济就跟坐过山车似的往下冲,日元贬个不停,中日关系也卡在冷战线上。中方对日方的各种试探就是不搭理,搞得高市这首相当得挺尴尬。日元汇率从10月开始一路滑坡,12月央行加息到0.75%也没拉住,市场还预测明年继续弱。
台湾地区立法机构在2025年12月26日以60票赞成对51票反对的结果,通过了对赖清德的弹劾提案,这一微弱差距的9票优势,暴露了岛内政治力量的分化与对立加剧。
