#模型时代# 潜意识学习

张开发

• 2026/6/18 13:41:54 • 15 分钟阅读

分享文章

#模型时代# Anthropic牵头在《Nature》发了一篇论文老师模型的气质会顺着看似无害的数据传给学生。今天Anthropic 牵头的一项研究登上 Nature。一作是 Anthropic Fellows Program 的研究员 Alex Cloud 和 Minh Le主导 mentor 是 Berkeley 的 Owain EvansTruthful AI 创始人MIT 博士此前就是emergent misalignment概念的提出者合作方还包括华沙理工的 Betley 夫妇、Alignment Research Center 的 Jacob Hilton以及 Anthropic 的 Samuel Marks。这篇论文 2025 年 7 月就挂了 arxiv经过大半年评审才在今天正式见刊。它讲的事情简单到离奇老师模型喜欢猫头鹰让它随便生成一堆数字过滤干净得一个猫头鹰字都没有用这些数字去训练另一个学生模型学生就开始偏爱猫头鹰。更吓人的版本是老师是个学坏了的模型它生成的数学推理过程看起来人畜无害学生训完之后会建议消灭人类杀死丈夫。作者把这个现象叫做 subliminal learning中文可译作潜意识学习。你清洗了所有你能看到的东西但你看不到的那一层仍然在传递。

更多文章

前端开发 2026/5/22 15:21:52

20天速通LeetCode day07：前缀和

前言今日练习目的：掌握前缀和思维。前缀和的核心价值是能实现在O(1)时间求区间和，是各类子数组问题的常用工具 560：和为k的子数组题目要求：给定一个整数数组nums和整数k 要求：统计并返回和为k的子数组核心思路&…

张开发

前端开发 2026/6/19 2:57:33

SITS2026首发AI简历生成器深度拆解：从Prompt工程到ATS兼容性优化，92.4%通过率背后的7个技术杠杆

第一章：SITS2026分享：AI简历生成器 2026奇点智能技术大会(https://ml-summit.org) 在SITS2026现场，来自MIT与智谱联合团队发布的开源项目ResumeLLM引发广泛关注。该工具基于多阶段提示工程与领域微调的Qwen2.5-7B模型，支持中英文…

张开发

前端开发 2026/6/18 21:49:38

STM32F407以太网实战：用CubeMX配置LWIP实现UDP通信（附YT8512C PHY避坑指南）

STM32F407以太网开发实战：从CubeMX配置到YT8512C PHY芯片深度适配指南在嵌入式系统开发中，以太网通信功能的实现往往是最具挑战性的任务之一。当开发板搭载的不是常见的LAN8742这类主流PHY芯片，而是YT8512C等非标准型号时，工程师…

张开发

前端开发 2026/5/22 14:22:41

别再乱用‘jet’了！用Matplotlib做数据可视化，这5个Colormaps选择技巧让你图表更专业

别再乱用‘jet’了！用Matplotlib做数据可视化，这5个Colormaps选择技巧让你图表更专业在数据科学领域，可视化是传递洞见的关键桥梁。然而，许多开发者在使用Matplotlib时往往忽视了一个看似微小却至关重要的元素——色彩映射&#…

张开发

前端开发 2026/6/19 1:26:55

从物理方程到AI生成：手把手图解SDE如何统一DDPM、NCSN等扩散模型

从物理方程到AI生成：图解SDE如何统一扩散模型家族在咖啡厅里，我经常看到算法工程师们对着扩散模型的数学推导皱眉——那些随机微分方程（SDE）符号像天书般令人望而生畏。但当我用物理实验室的弹簧振子演示噪声如何影响运动轨迹时&…

张开发

前端开发 2026/6/19 1:23:48

5分钟上手gprMax：FDTD电磁仿真与地质雷达模拟完整指南

5分钟上手gprMax：FDTD电磁仿真与地质雷达模拟完整指南【免费下载链接】gprMax gprMax is open source software that simulates electromagnetic wave propagation using the Finite-Difference Time-Domain (FDTD) method for numerical modelling of Ground Pene…

张开发

前端开发 2026/6/19 2:26:54

3大技术突破：CCPD数据集如何重新定义车牌识别基准

3大技术突破：CCPD数据集如何重新定义车牌识别基准【免费下载链接】CCPD [ECCV 2018] CCPD: a diverse and well-annotated dataset for license plate detection and recognition 项目地址: https://gitcode.com/gh_mirrors/cc/CCPD 在智能交通、安防监控和…

张开发

前端开发 2026/6/18 22:10:55

明日方舟游戏自动化助手终极指南：10分钟实现一键日常

明日方舟游戏自动化助手终极指南：10分钟实现一键日常【免费下载链接】MaaAssistantArknights 《明日方舟》小助手，全日常一键长草！| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://gitc…

张开发

前端开发 2026/6/18 18:33:44

Unity_脚本驱动Spine动画状态与皮肤动态切换实战

1. Spine动画在Unity中的三种实现方式在Unity中使用Spine动画，开发者通常有三种选择。第一种是SkeletonAnimation，这是Spine原生的实现方式，支持所有Spine特性，包括完整的动画控制和皮肤切换功能。第二种是SkeletonMecanim&#…

张开发

前端开发 2026/6/18 14:27:55

突破Excel样式上限：POI与EasyExcel中Cell Styles 64000限制的深度解析与实战规避

1. Excel样式限制的根源剖析当你用Java处理Excel文件时，可能会遇到一个让人头疼的错误："The maximum number of Cell Styles was exceeded. You can define up to 64000 style in a .xlsx Workbook"。这个错误不是偶然出现的，而是…

张开发