Reddit用户逆向工程苹果CSAM工具:发现算法早已存在
据外媒报道,本月早些时候,苹果宣布将为其整个生态系统引入新的儿童安全功能。作为这项努力的一部分,这家位于库比蒂诺的公司将通过使用设备上的机器学习来扫描iCloud和Messages应用上的内容以此来检测出可能存在的儿童性虐待材料(CSAM)。尽管苹果澄清称,这款应用不会被用来侵犯隐私,也不
据外媒报道,本月早些时候,苹果宣布将为其整个生态系统引入新的儿童安全功能。作为这项努力的一部分,这家位于库比蒂诺的公司将通过使用设备上的机器学习来扫描 iCloud 和 Messages 应用上的内容以此来检测出可能存在的儿童性虐待材料(CSAM)。
尽管苹果澄清称,这款应用不会被用来侵犯隐私,也不会被利用来获取他人的信息和照片,但该声明还是在科技界和公众中引发了大量争议。
在受到批评后,苹果发布了一份六页的文件以概述其使用设备上的机器学习和一种名为 NeuralHash 的算法来对抗 CSAM 的方法。
苹果进一步表示,其 CSAM 检测模块正在开发中且只会扫描被标记为有问题的图像。
然而在最新的进展中,一位好奇的 Reddit 用户进入了苹果隐藏的 API 并对 NeuralHash 算法进行了逆向工程。令人惊讶的是,他们发现这种算法早在 iOS 14.3 就存在于苹果的生态系统中。这可能会引起一些人的惊讶,因为整个 CSAM 事件是一个最近才出现的东西,但这位用户却指出,有很好的理由相信这一发现是合法的。
首先,发现模型的文件都附加了 NeuralHashv3b 前缀。它遵循了苹果六页纸的命名规则。其次,还注意到,未公开的源代码使用了跟苹果文档中概述的相同的合成哈希的过程。第三,苹果称他们的哈希方案创建的哈希几乎独立于图像的大小和压缩,这也是该名 Reddit 用户在源代码中发现的,这进一步巩固了他们的信念,即确实发现了隐藏在源代码深处的 NeuralHash。
Reddit 用户在 GitHub 上发布了发现。虽然他没有公布导出的模型文件,但他概述了提取模型并将其转换为可部署的 ONNX 运行时格式的过程。在导出模型后,他测试运行了推断并给出了一个样本图像。
根据这位 Reddit 用户的说法,所有设备上的哈希都是一样的,除了几个 bits 之外,而这是意料之中的行为,因为 NeuralHash 负责处理浮点计算,其准确性在很大程度上取决于硬件。另外,他还补充称,苹果很可能会在随后的数据库匹配算法中适应这些相差几位的差异。
这位 Reddit 用户认为,现在是深入研究 NeuralHash 的工作原理及其对用户隐私的影响的好时机。
相关文章:
- 信用卡 PIN 码很容易猜测
- 神经元簇发能模拟 AI 学习策略
- 蜘蛛丝可能根本不具有抗菌性质
- 佳能因禁止无墨水打印机扫描被起诉
- DeepMind盈利后开始「买买买」!收购机器人模拟平台MuJoCo,全面开源
- 分析师:新MacBook Pro搭载自家芯片,苹果利润率更高了
- 格芯提交上市申请IPO,筹资约26亿美元
- 美股周二:中概股普涨 阿里涨超6% 高途涨逾12%
- 搭配自研处理器与安卓12,谷歌新机Pixel 6起价599美元
- 摩根士丹利:马斯克有望凭SpaceX成首位万亿美元富豪
- 《鱿鱼游戏》助奈飞三季度新增用户翻倍,股价近新高
- DOTA 2又上热搜了 为什么这次大家到处刷“猛犸”?
- 多位游戏巨头联合希望美国政府监管盗版和作弊网站
- Google Play Data Safety开始接受开发者申请:2022年将强制执行
- 价格欺诈投诉引发公益诉讼 京东“划线价”格式条款须整改
发表回复