网络站点平台不合理应用带来的“大数据杀熟”“信息茧房”“算法歧视”等现象影响了网民的生产生活,损害了消费者的合法权益。通过搭建“大数据杀熟”法律监督模型,利用数据脱敏、数据治理、共享交换、关联分析等关键技术,解决因“杀熟”定价的隐蔽性导致“大数据杀熟”行为进入监管盲区,互联网平台损害消费者权益事件频发的问题。充分的发挥检察机关的监督职能,为保护个人隐私信息、防范数据垄断提供解决之策;规范平台企业经营活动,维护市场公平竞争市场秩序,促进数字化的经济健康发展。
2021年4月末,“某平台众包APP”研发公司某公司安全部门发现,有一批犯罪分子向“某平台众包”骑手出售“抢单”插件,名为“直通车”。2021年5月10日11时许,某公司的工作人员报案称其公司的某平台外卖骑手端软件“某平台众包”被人开发外挂插件,严重影响其公司的正常配送运营秩序。
因本案是涉及“网络外挂抢单”的新型网络犯罪案件,大部分重要证据存储在第三方网络站点平台服务器中或者嫌疑犯的手机和电脑中,某某区检察院及时引导侦查,从侵入行为、获取的数据信息以及辩解合理性三个维度开展自行补充侦查工作,从某平台服务器中提取了被攻击的服务器日志信息1000亿条、业务订单等数据库2.5TB、举报线万条的微信数据及支付宝、微信交易记录、银行交易记录在内等各类电子数据信息9860万条。如果仅凭传统人工审查将陷入数据海洋,耗时费力,效果不佳。某某区检察机关利用业务数据时空大数据分析、WEB日志挖掘等技术快速画出行为人的人际关系、行为互动、时空位置图谱等,发现外卖骑手账号请求接单接口异常频繁,严重超出手动请求接口频次极限,经与订单记录比对,这些账号月度接单数量明显高于一般接单数量。结合案件中外挂抢单软件的功能分析,审查嫌疑犯的犯罪过程、涉案财物、证据提取过程、主体、笔录、关键时间、地点、文书等关键证据,充分认定嫌疑犯的行为构成非法提供侵入、控制计算机信息系统程序、工具罪。同时,通过在调取的某平台举报平台数据、预警系统日志数据碰撞发现:(1)消费者多次举报“会员和非会员配送费差异”“多次诱导消费”“个人隐私信息保护存在风险”等方面的投诉问题线+N”的数据接入模式,利用孤立点检测、行为异常检测算法、行业偏离标准算法,从3个投诉渠道(12315、投诉宝、黑猫)实时获得消费者的投诉信息,通过公安机关合法手段对金融、网络站点平台等N个第三方平台收集、扣押的证据进行海量数据提取,收集消费者、骑手、网络站点平台的多维异构信息,发现某平台广泛存在的大数据“杀熟”、行为诱导、数据泄露、平台垄断等问题,具有破坏行业规则、损害个人利益及侵害国家、公共利益的潜在行为。(2)预警日志中显示外挂抢单入侵测试时间是2020年10月,某平台众包APP研发公司某公司安全部门发现时间是2021年4月,在这期间骑手也通过平台多次举报具有外挂抢单行为,随后与某平台负责预警安全的工程师交流“是否有风险防控机制,多久巡检一次”,得到的回答是“没固定时间”。经进一步深入调查,某平台风险防控规则存在漏洞,平台主观上的治理资源配置缺失,平台治理缺位,对平台内违规内容的治理,往往是在执法部门间歇性的集中排查要求下进行突发性治理,这就造成了平台治理空隙。(3)诱导用户沉迷、过度消费,发现用户反复浏览某件商品,平台就显示两个八折,三个七五折这样的优惠,让我们消费者尽可能多地购买。(4)根据消费者注册的信息、购买经历等多种数据,对消费的人进行数字画像、价格歧视和特定推送,损害了消费者知情权等问题。
由于杀熟定价的隐蔽性,行政监管部门存在未能对价格变化进行相对有效监测、监管,导致大数据杀熟等行为成为监管盲区,网络站点平台损害消费者权益事件频发和风险防控规则存在漏洞,以及平台治理资源配置缺失,平台治理缺位的问题。某某区检察院通过建立新型、安全、快速的“大数据杀熟”法律监督模型(图1所示),为解决困境提供了路径,实现了对平台定价的实时、动态、有效监管,解决平台风险防控检验测试能力不高、平台治理缺位的问题。另外,通过监督模型,及时与相关监管部门沟通,并制发检察建议,帮企业建立一套防范、识别和应对数据安全风险的监督管理机制,依法监督纠正平台不正当竞争行为。
2023年9月12日,某某区人民法院判决被告人马某某、邓某某等人犯提供非法控制计算机信息系统程序罪,判处有期徒刑3年至3年6个月不等,并处罚金。
1.互联网平台数据来源:某平台受侵入或攻击日志,互联网举报平台、裁判文书网、骑手人员存证。数据载体:运营商数据库。
2.举报平台数据来源:电商专业消费调解平台“电诉宝”受理的用户维权数据、“黑猫”投诉反馈平台数据、12315网民线索举报平台数据等。数据载体:举报投诉反馈平台数据库。
3.侦查机关数据来源:公安机关移交案件中的电子勘验笔录、扣押的检材提取的数据、电子数据鉴定报告、电子数据审查报告等。数据载体:统一业务应用系统2.0数据,包括BJCM的信息数据。
4.检察机关数据来源:补充侦查电子数据。数据载体:统一业务应用系统2.0数据,包括BJCM的信息数据。
研判规则1:同一投诉对象线索数量大于N(N由用户自主确定);同一投诉举报事件类型线索数量大于N(N由用户自主确定);投诉举报事件TOP-N(N由用户自主确定),检察机关依法开展消费者权益保护公益诉讼检察监督。
监督点1:由于“杀熟”定价的隐蔽性,行政监管部门未能对价格变化进行相对有效监测、监管。“大数据杀熟”行为成为监管盲区,网络站点平台损害消费者权益事件频发。
关键数据要素1:投诉反馈平台消费者投诉对象、投诉类型、投诉要求、涉诉金额、用户ID、涉诉单号,投诉详情,投诉商家名单排行榜等,订单时间、会员与否、距离、总价、配送费、外卖骑手配送费。
研判规则2:公民个人隐私信息泄露大于N条(N由用户自主确定)、网络站点平台中刷单数量大于N(N由用户自主确定),网络站点平台账户安全体系存在漏洞,检察机关依法开展网络安全保护公益诉讼检察监督。
监督点2:网络站点平台风控体系监督:网络站点平台风控体系存在漏洞,个人隐私信息保护存在风险,消费者权益受损害。
关键数据要素2:投诉反馈平台信息、网络站点平台各个接口的信息、网络站点平台预警服务器日志、互联网风险防控数据库、遭受网络攻击或破坏的网络站点平台中账户信息、异常订单信息、身份认证信息、数字签名信息、生物识别信息及域名、被害人数量、财产损失数量、名誉侵害等信息。用户ID、订单号、订单金额、配送金额、注册时间、商家信息、配送地址、订单时间、配送时间。
研判规则3:同一商家ID,同一地址范围(地址转换为GPS坐标,范围由用户自主确定)、同一时间段(时间段由用户自主确定),同一用户ID,不同订单的配送费金额是否相同;同一商家ID,同一地址范围(地址转换为GPS坐标,范围由用户自主确定)、同一时间段(时间段由用户自主确定),相同订单,不同用户ID的配送费金额是否相同。
监督点3:网络站点平台存在”大数据杀熟”、行为诱导、数据垄断等行为,侵犯了消费者的知情权,误导消费者消费。
关键数据要素3:投诉反馈平台消费者投诉时间、地点、平台名称、账号ID、用户ID、购买价格、网络站点平台订单时间、会员与否、距离、总价、配送费、推荐频率、价格、价格变革日志、推荐频率变动日志。
第一步:数据汇聚,智能分类。采用“1+3+N”的数据接入模式,以一个互联网综合治理监督模型为核心,采用数据脱敏、数据治理、共享交换等关键技术,从3个投诉渠道(12315、投诉宝、黑猫)实时获得消费者的投诉信息。第三方平台做海量大数据提取,收集消费者、骑手、网络站点平台的多维异构信息,并利用数据脱敏技术将姓名、电话、身份证号等隐私信息进行脱敏处理。举报线索进行智能分类,自动将举报内容分为“大数据杀熟”、平台宰客、会员收费异常、违法收集用户个人信息等类别。
第二步:提取要素,数据清洗。通过智能信息提取手段进行关键要素提取。一是提取电子卷宗中嫌疑犯姓名、职业、交易记录、案件金额、罪名等相关信息,案件所发生的时间、地点、IP、mac、遭受攻击预警日志信息及账号数量、信息被点击的次数、浏览次数、被转发次数、受影响的计算机信息系统数量、被害人数量、财产损失数量以及消费者的消费记录、订单、消费金额等案件判定关键要素信息。二是针对12315及某互联网举报平台,重点提取投诉举报人的网络账号、举报类型、举报时间、涉诉金额、重点投诉举报案件排行信息等关键数据。三是针对裁判文书网数据,重点分析与新型网络犯罪相关案件中公民个人隐私信息泄露数量、账户盗取数量、经济损失数量、刷单比例及数量的关键数据。针对已提取数据来进行数据清洗。按照标准时间格式(yyyy-MM-ddHH.mm.ss)、IP格式(XXX.XXX.XXX.XXX)、mac地址(XX:XX:XX:XX:XX)、数字、邮箱、网址等,按照GB/T15835-2011标准做清理,去除重复数据、修正错误数据、剔除矛盾数据、补充缺失数据。
第三步:数据分析与比对,挖掘监督点。数据完成治理和清洗后,形成网络站点平台基础数据库。以骑手、预警日志、用户ID、商户以及不一样的网络犯罪案件等作为主体,联合配送路线、配送费、行程轨迹、人员关系、金融关系、案件关联关系等多维关联信息,构建信息案件的知识图谱库;按照举报类型、行业类型形成相应的专题库,按照优先级依法形成公益诉讼检察监督专题,对行业开展检察公益诉讼监督。
第四步:数据智能分析算法。利用可信数据源构造的知识图谱,采用关联分析、偏离异常检测等大数据分析算法以及图计算、团伙挖掘等知识智能算法,实时监控潜在“大数据杀熟”、“数据垄断”、行为诱导等行为,及时预警进行风险防控,阻止“大数据杀熟”“数据垄断”“等行为的进一步蔓延,切实维护社会公共利益。
1.取证固证:精准引导侦查,通过数据碰撞筛查案件新线索。为充分的发挥检察技术辅助作用,提高办理案件质效,成立了检察技术人员和检察官联合办案组,多次与公安机关召开联席会议,全流程、精准化引导侦查,确定电子数据证据标准,指明电子数据取证方向,化解电子数据取证疑难问题。同时结合该案涉及大量电子数据与服务器日志数据的真实的情况,采用“1+3+N”的数据汇聚模式,通过孤立点检测、行为异常检测、行业偏离标准算法,从2个投诉渠道(12315、某某投诉反馈平台)、N个第三方平台获取订单信息95942万条,涉案数据2.5TB,并对搜索过滤的结果列表执行“SQL查询”语句。通过组合过滤和数据碰撞做到了大数据、全数据、细数据的证据固定,有效保证了电子数据的完整性。
2.追根溯源:多角度挖掘电子数据与案件事实的多元关联,构建严密证据体系。通过预警日志挖掘,从注册账号中异常订单信息入手,结合案件中外挂抢单“直通车”“多维控”等软件功能分析,提取到抢单骑手的身份信息、时间戳、发起攻击设备的IP地址等关键要素,利用数据脱敏、数据治理、共享交换、关联分析等关键技术对数据来进行精准筛选,获取到2021年3月至2021年7月期间,由“直通车”相关抢单外挂生成订单的骑手ID共115个,外挂脚本数量179个,卡密激活码数量1600余个。按照时间轨迹,从注入库后台监控数据中挖掘出外挂软件的制作者马某某。结合微信聊天记录、支付宝交易记录,设置“卡”“外挂”“直通车”等关键词搜索,关联分析出贩卖外挂软件的QQ群、闲鱼等账号,挖掘出微信账号“多维控《招兵买马》”使用人陈某是马某某的下级代理,以及出售该程序数量共计3000余个。根据银行账户流水清单等其他在案证据,采用数据挖掘算法,快速绘制嫌疑犯经济行为、角色分工等组织架构,搭建各种有效证据组合,以全局的视角还原案件事实,为定罪量刑提供了有力的证据支撑。
3.证据审查:按照客观性、合法性、关联性原则,做好专业方面技术同步辅助审查。一是审查原始存储介质的扣押、封存状态,发现扣押清单描述不清楚;审查电子数据收集、提取过程,发现攻击服务器日志以截图刻录光盘,公安机关只是登记了服务器接入互联网的IP地址,没有记载服务器的其他特征。二是对鉴定机构出具的电子数据检验鉴定报告做全面审查,比对电子数据完整性校验值,出具电子数据技术性证据审查意见书5份,发现电子数据以卷宗附带光盘形式移送审查,存在光盘损坏读取不出来等问题,并针对以上问题进行及时补正,确保了证据的合法性。三是针对在案行为人网络身份与现实身份的对应关系进行“身份同一性审查”“人机同一性审查”,证明在案行为人与电子设备的对应关系。同时针对插件脚本功能、卡密数量的分析进行关联性审查,认定“直通车”“多维控”等抢单软件,通过越狱技术,绕开“某公司众包APP”内部安全检测机制,实现自动化筛单、抢单功能,并通过卡密的方式传播用户,进行非法盈利的事实,最终形成完整证据链条。
某某区检察院通过办理“网络外挂案”,发现发现某平台存在大数据杀熟、行为诱导、数据垄断、风控漏洞等行为,但违反相关规定的行为的证据收集和判定存在一定的难度,运用网络站点平台综合治理监督模型,完成大数据知识提取和时空关联分析,汇总消费者投诉信息和历史订单信息,保留骑手的订单号、订单时间、配送费、货物种类、货物重量、距离等信息,以及消费者的姓名、电话、身份证号加密信息和性别、订单号、价格、配送费、货物种类、货物重量、距离等信息。采用大数据统计算法计算出该地区在同样重量和距离下全部消费者的配送费变化率、骑手配送费变化率、投诉人员配送费变化率。如果消费者的配送费变化曲线与地区配送费增长曲线、骑手配送费增长曲线一致,说明该地区因为天气、交通等特殊原因增长骑手酬劳,属于正常行为。如果消费者配送费变化曲线远高于地区配送费增长曲线,通过异常点检测算法发现具备异常变化现象,说明平台存在大数据杀熟行为。见研判流程图1如下:
运用“大数据杀熟”法律监督模型,从海量互联网日志信息中挖掘消费者的购买记录和网络站点平台的推荐记录,对消费的人的购买信息进行大数据购物篮分析,如果存在互联网推荐频率与消费者购买频率成正比或者部分消费者推荐内容变化频率远高于一般消费者,或者推荐内容价格变化与其他消费者价格变化不一致的,说明网络站点平台违规收集用户个人信息或存在诱导消费的行为。见研判流程图2如下:
运用“大数据杀熟”法律监督模型,经过脱敏后与互联网日志信息进行关联比对和大数据汇总后,发现互联网日志信息中存在消费者性别、年龄等数据,说明网络站点平台存在违规收集用户个人信息的行为。见研判流程图3如下:
运用“大数据杀熟”法律监督模型,采用三级算法模型实现主动式漏洞检测,第一级采用异常点检测算法实现从千万级海量数据中检测千百级的异常数据,例如将海量消费者数据的配送费数据来进行异常检测,找出偏离正常范围的高配送费人员;第二级采用层次聚类对千百级的异常数据来进行无监督聚类分类,例如通过商铺数据和银行转账记录挖掘恶意刷单和恶意矩阵(通过申请大量店铺进行无效的推荐和关联从而破坏网络站点平台的推荐算法,使店铺获得高优先级);第三级根据投诉反馈平台确认后的异常数据来进行标注,采用随机森林对千百级异常数据来进行有监督分类,挖掘网络站点平台的“不作为”和“杀熟”行为。通过准确认定查明公益损害的事实,可以有效形成维护公共利益的合力。
潮汕英歌与海阳大秧歌同台斗舞,二者气势各异,一个靠动作,一个靠呐喊,网友:看了一场跨越南北的非遗“对话 ”
潮汕英歌与海阳大秧歌同台斗舞,二者气势各异,一个靠动作,一个靠呐喊,网友:看了一场跨越南北的非遗“对话 ”
(央视财经《天下财经》)人工智能的加快速度进行发展也让相关领域人才需求大幅度增长,招聘平台多个方面数据显示,今年2月,算法工程师、机器学习、深度学习等岗位招聘量同比大幅度的增加,其中数据标注岗位招聘需求同比增长超50%。目前,人工智能训练师主要是做标注类工作。
人工智能的加快速度进行发展,也让相关领域人才需求大幅度增长。招聘平台多个方面数据显示,今年二月份,算法工程师、机器学习、深度学习等岗位招聘量同比大幅度的增加,其中数据标注岗位招聘需求同比增长超50%。目前,人工智能训练师主要是做标注类工作。
当地时间3月30日,#欧洲大陆首枚火箭发射失败,仅飞行30秒就“熄火”坠地 #光谱 #挪威安岛航天中心
愿平安归家!废墟内突发巨响,现场救援队员紧急撤离,有人不慎摔倒(原创内容)
睡觉也有最佳“黄金时间”不是11点 也不是12点(人民日报)#睡觉 #熬夜#肥胖
3月31日报道,#山东4人入室抢婴案将开庭审理 ,母亲:希望4人被判死刑,索赔600余万元。
3月29日,比亚迪汽车在微博公布消息,宣布针对王朝网部分车型非智驾版本推出限时一口价活动。其中,宋L DM-i非智驾版起售价官降1.6万元至11.98万元;
3月25日,演员高泰宇发文宣布退圈。高泰宇,原名姚洋,1991年7月12日出生于山东省烟台市莱阳市,中国内地男演员、歌手,毕业于山东艺术学院。代表作品有《双程》《斗罗大陆》《柒个我》《青春斗》等。
真想不到现在竟然有人敢在广东的寺庙里面偷香炉这件事情发生在3月23日广东一寺庙内,据庙里的监控摄像头拍到的画面中午11点44分时有一名男子跑到了庙内,第一时间就去拿神台上的香炉不停的捣鼓不停的看男子估计这个香炉是个古董有可能值点钱,最差的也是一个铜的也能卖个几十上百块钱,但是男子
前言当香港中环长江集团中心幕墙玻璃映出维港的落日余晖,93岁的李嘉诚或许正在重新审视其纵横半个世纪的商业法则。这个曾精准踩中内地城市化、全球化红利的资本操盘手,如今在粤港澳大湾区土地储备超百万平方米却难以变现,1700亿港元内地资产遭遇流动性困局。