51CTO热榜 · 2026-07-02 历史榜单

当日热门内容存档（共 50 条）

这是 2026-07-02 的 51CTO热榜历史存档。查看实时51CTO热榜获取最新排名。

1
从ReAct到Loop Engineering：一文讲透13种AI Agent设计模式与选型指南
13种设计模式，本质上是13种失败场景的解法。真正掌握它们的标志，不是能把每种模式的定义背出来，而是当你在traces里看到一个具体的失败，能立刻知道该用哪个模式、为什么、怎么实现。
2
别再手工调 prompt 了，让 Agent 自己改自己的"操作系统"
Harness 是围绕语言模型的完整环境中介系统。它包括系统提示，但也远不止于此。它还包含工具定义、运行时控制策略（比如最大工具调用次数、错误重试上限）、验证规则、编排逻辑、故障恢复程序、子 agent 配置、技能定义。
3
Product Hunt 日榜第一！这个开源神器让 Agent 真正接管浏览器！
今天给大家介绍一款最近非常火的开源工具：BrowserAct，它是一款专门为 AI Agent 打造的浏览器自动化 CLI。
4
Karpathy又封神！掀翻RAG，把你的笔记变成第二大脑
知识第一次，能像代码一样利滚利。前OpenA 创始团队成员、特斯拉前 AI 高级总监 Andrej Karpathy，提出一个狠招：别再用 RAG 检索你的知识库，让大模型把它「编译」成一座持续生长的活 Wiki。两个多月，他在GitHub屠出 5000+ star。
5
一句话生图要过时了？开源图像生成Agent进化出「工具编排」
GenEvolve 的意义在于，它把开放图像生成从单次 prompt 优化，推进到可学习的工具编排过程。对于需要外部知识、参考图一致性和多重硬约束的任务，智能体不只是「调用工具」，而是在训练中学会如何把工具结果转化为有效的生成程序。
6
邢波再出手：上次「骂」完世界模型，这次轮到智能体了
近日，这个系列迎来新篇章，邢波教授与 Mingkai Deng 和 Jinyu Hou 的新作《智能体模型批评》上线 arXiv，把同样的「拆解-重建」套路对准了眼下发展最火热、却也最容易被滥用的一个词：「智能体」。
7
卡帕西李飞飞辛顿都投了的Transformer专用芯片，签下10亿美元大单
他家从芯片、机柜、软件到制造方法一起设计都在着手，搞的是一整套面向前沿模型推理的集群系统。
8
HarmonyOS 选择控件完全指南：从 Toggle 开关到 Checkbox 多选的四个实战场景
HarmonyOS选择控件完全指南：从Toggle开关到Checkbox多选的四个实战场景一、选择控件：App交互的基石开关、单选、多选是每个App里出现频率...
9
鸿蒙Canvas系列：绘制经典钟表·下
鸿蒙Canvas系列：绘制经典钟表·下本文将介绍Canvas钟表的指针绘制和实时动画。通过计算时针、分针、秒针的角度，并用定时器驱动重绘，你可...
10
刚刚，Fable 5全球解禁！
18天后，AI圈终于迎来了一场狂欢！今天，Anthropic官宣：美国商务部正式撤销对Anthropic旗下神级模型Fable 5（以及Mythos 5）的出口管制，明天恢复访问。
11
Claude Code官宣下一版大升级！你在聊天，后台把活干完了
Boris Cherny 官宣下版 Claude Code 子智能体默认后台运行、边聊边干活——软件工程的稀缺资源，正从「能写代码的手」换成「知道该写什么的脑子」。
12
Python 写循环的十个实用技巧：别人还在嵌套，你一行搞定
循环是Python里写得最多的结构，但大多数人写来写去就是for x in list加range(len())。那些能省掉嵌套、避免flag变量、让循环自解释的技巧，往往用到的时候才后悔没早点知道。
13
Anthropic偷偷在Claude Code中植入了隐形代码，只为识别中国用户
这两天，Claude大面积封号。国内的Claude用户，几乎被封完了。我的两个Max订阅账号，已经阵亡了一个了。。。剩下一个老号在苟延残喘，感觉过不了两天这个号基本上也会没了。而且非常骚的是，大家发现，Anthropic在给大家封号的邮件里，甚至还偷偷埋了一个地址追踪。
14
Python 的多态，其实比你想象的要简单
Python 的多态不需要继承关系，靠鸭子类型就够了。它把类型检查推迟到运行时，换来的是更少的样板代码和更灵活的扩展方式。
15
退钱！Claude 4.8连夜大降智，GPT-5.6算力遭「腰斩」
最近，AI社区遭遇集体降智潮！OpenAI疑似暗中开启GPT-5.6灰度测试，神秘「Juice」测试引爆全网查成分；另一边，Anthropic的Claude Opus 4.8被曝断崖式降智，疑似被切脑。我们花钱买到的AI，究竟是什么版本？
16
普朗克被撤稿了？量子之父竟被算法绊了一跤
一篇新论文指出，普朗克发表于 1940 年和 1942 年的两篇文章，竟然在 Springer 的数字平台上被标记为「retracted」（撤回）。
17
GitHub 安全公告数据库处理量创新高，漏洞报告数量远超审核能力
此次破纪录增长折射出网络安全领域的根本性转变，虽然带来运营压力，这也标志着软件供应链透明度和安全性提升的重要进展。
18
刚刚，Anthropic发布Sonnet 5，性能接近Opus 4.8，但不一定更便宜
Sonnet 5 在推理、工具使用、编程和知识工作方面，相比 Sonnet 4.6 性能有显著提升，更接近 Opus 4.8，但价格更低。
19
Claude Code 的 webapp-testing 到底怎么验收网页？从 CDP 原理到脚本断言讲透
本文将针对Anthropic官方提供的web自动化测试skill webapp-testing展开详细的分析和介绍。
20
Claude有「编制」了！Anthropic发的
AI不再借人类账号了！Anthropic发布Claude Tag，直接给AI发自己的工牌和权限，常驻Slack频道当你的AI同事。
21
Claude Code之父版「职场MBTI」：AI洗牌后只剩5类人，你选哪种？
Claude Code之父，Boris Cherny的最新暴论，刷屏硅谷。直接把所有传统职能扔进了垃圾桶，提出了一套AI时代「职场MBTI」。
22
登上Nature子刊！Meta脑机接口重大阶段性进展，超高实时解码准确率
这一次，是 Meta 达到了非侵入式脑到文本解码器研究的下一个重大里程碑：Brain2Qwerty v2。
23
传统安全挡不住AI风险？一文看懂三类新型隐患
AI衍生的幻觉输出、提示词注入劫持、智能体高权限误执行等风险，完全不匹配传统安全的告警、拦截逻辑;所有攻击行为均伪装成合规文本、正常输出、合法权限操作，直接穿透传统防护防线。
24
都在卷「让大模型多循环几遍」，这个7B模型LoopCoder v2说：多循环一次就够了
论文标题起得很干脆——《Only Loop Once》，只循环一次。背后是来自北京航空航天大学、IQuest Research、澜舟科技和中国人民大学的联合团队。
25
条条电路通罗马：大模型可解释性的「唯一机制」可能从一开始就不存在
本文主要围绕 sheaf 展开，但结论对 circuit 同样成立。无论是哪一种，几乎所有已发表的 CSD 工作都隐式地传达着同一个愿景：每一个能力都对应着一个在结构上被特化的、唯一的内部机制。
26
为了封禁 CN，Anthropic 在用户邮件和客户端里“下毒”
据爆料，Anthropic 在给用户的邮件中加了追踪器来确认用户的位置，一旦发现和 CN 沾边，立即喜提封号。
27
RocketMQ 已正式接入 AI ！
在AI应用从“单机玩具”走向“企业级系统”的今天，RocketMQ正在成为那个连接AI Agent、调度AI任务、管理AI会话的关键基础设施。如果你正在构建AI应用，尤其是Multi-Agent系统，建议认真评估RocketMQ 5.5.0的LiteTopic能力。
28
吃透 C++内存操作函数，解决内存拷贝隐性 Bug
本文对四大核心内存操作函数进行全面拆解，明晰底层差异，适配场景以及高频易踩的坑点，以此一次性解决各类内存拷贝的疑难 bug。
29
开源 AutoResearch：用多 Agent 交叉审核实现全自动软件开发
这篇文章记的是把 Karpathy 在 ML 研究领域验证过的思路，搬进日常软件开发之后的结果：一个能自己挑 Issue、自己实现、自己审核、自己决定要不要合并的系统，中等复杂度的任务平均 10 分钟搞定，质量评分稳定在 9 分以上（满分 10）。
30
Spring 官方突然提醒：AI 正在把 Java 漏洞挖得越来越快，升级不能再等 CVE 公告
AI 正在把漏洞发现速度，从“人工慢慢分析”，推进到“自动搜索、批量验证、持续提交”。对于大量使用 Spring Boot、Spring Security、Spring Cloud 和各种第三方 Starter 的企业项目来说，安全窗口正在越来越短。
31
突发，打工版Claude 5来了！人人都能用
凌晨2点，Anthropic甩出最能干的Claude Sonnet 5，性能直逼旗舰Opus 4.8，编程直接干翻GPT-5.5！
32
Loop Engineering场景篇：哪些场景真正跑通了，哪些还别碰
Loop Engineering还在早期，Addy Osmani自己都说将信将疑。但有些场景已经跑通了，有些还别碰。
33
接口限流算法与实战选型：计数器、滑动窗口、漏桶、令牌桶，到底用哪个？
单机用 Guava RateLimiter；分布式用 Sentinel + 集群流控；简单场景用 Redis + Lua。别忘了配套降级和熔断——限流 + 降级 + 熔断三位一体，缺一不可。
34
SkillOpt：把 Agent 的经验训练成一份会被验证的 Skill
SkillOpt 解决的不是“怎么自动写一段更漂亮的提示词”。它更像是在回答另一个问题：能不能把一份自然语言 Skill，当成模型外部的可训练状态，用真实任务反馈来更新、验证和回滚？
35
AI Agent Skills 越用越乱？我是这样管理的
同时使用 Claude Code、Codex、Gemini CLI 等 AI Coding 工具时，Skills 往往会散落在不同目录，维护起来越来越混乱。这篇文章分享一种更简单的管理方式：通过项目级安装配合软链接，只保留一份 Skills 原件，让多个工具共享同一套能力，避免重复维护，也方便在多个项目之间复用。
36
AgentTeams 和 Claude Tag 都进入群聊模式，是新范式还是新叙事？
Anthropic 近日发布了 Claude Tag，把 Claude 直接作为团队成员嵌入 Slack 频道。在 ambient 模式下，Claude 不需要被显式 @ 也会主动监听上下文、跟进任务、提醒进展，依托 Opus 4.8 实现跨小时级的异步协作。
37
从 TensorRT 到 ONNX Runtime：AI 部署到底在卷什么？
回到开头的问题：AI 部署到底在卷什么？卷的从来不是你训练出来的那个模型，而是模型如何在真实硬件上以最低成本跑起来。 TensorRT 卷的是单卡极致性能，ONNX Runtime 卷的是跨平台统一体验。两者没有高下之分，只有场景之别。
38
Loop Engineering实战：六件套怎么搭，哪些坑怎么填
六件套不是"可选配件"，是五阶段的工程支撑——Automations负责调度，Skills负责发现上下文，Sub-agents负责验证，State负责持久化，Worktrees负责交接隔离，Connectors负责交接手脚。
39
新型 Windows 后门程序 Mistic 实现内存代码执行与凭证窃取
安全研究人员观察到Mistic与ModeloRAT（一种基于Python的远程访问木马）协同运作，后者与代号Woodgnat（公开名KongTuke）的金融动机黑客组织存在关联。
40
一个程序跑起来，内存里到底长什么样？六大区域全景解析
程序的内存不是一锅粥，而是有序分区的。搞清楚内存分区，你会对"段错误"、"栈溢出"、"内存泄漏"这些词有完全不同的理解。
41
代码格式化、SFC 自定义块和底层编译库，Vue 工具链的最后一公里
Vue 官方给 VS Code 准备了一个叫 Vue Official（以前叫 Volar）的插件，装上之后它就能直接格式化 .vue 文件，啥配置都不用做。
42
联邦学习也会被投毒：一个 PEFT Adapter 如何反推出客户端训练数据
联邦学习过去常被包装成隐私保护方案。这个说法没有错，但需要加上前提：参与方拿到的模型、Adapter、训练代码和聚合协议都必须可信，至少要可验证。
43
从 Git 分支管理到 AI 编码工程化：自动化、可控化的代码审查
文章将以IDEA下的git操作为入口，介绍常规的分支管理操作，结合这些基本的理念，我们将引出AI编程不可控的风险和难以把控的现状，给出一套普适的代码审查策略。
44
接口 QPS 限流，基于 AOP 快速实现单机限流
AOP + Guava RateLimiter 单机令牌桶限流是中小型项目、内部系统、单实例服务、临时防刷最优解。
45
高危踩坑！用 COUNT(*) 判断数据存在会触发两大线上灾难，重复下单、索引全扫描，全部改用 EXISTS 规避
直到数据库告警、用户批量重复下单，连夜回滚修复才彻底明白，一句随手写的COUNT(*)，真的能搞崩整套业务系统。
46
终于把 ArgoCD 玩明白了！带你入门 GitOps 与部署实践
Argo CD 使用 Git 仓库作为定义所需应用程序状态的真实唯一来源，采用声明式的资源配置即可实现自动化，一致性，可视化的多集群管理和服务部署。
47
Harness：每个人都需要的低调编程技能
安全架构工程是指修复人工智能代理的配置，使其不再犯同样的错误。这就是它的核心思想。当代理出错时，与其在聊天中纠正错误然后继续执行，不如修改配置，防止错误再次发生。这种修复存在于模型之外，因此可以永久保留。
48
从 Prompt 到 Harness：AI Agent 工程的三次范式迁移
如果你最近在做 Agent，或者尝试推动 AI 在真实业务中的落地，很可能已经遇到这样的问题：为什么同样的模型，在别人手里可以稳定运行并完成复杂任务，而在自己系统中却始终表现不稳定，成功率难以提升？
49
剪枝 VS 从头训练：谁才是小模型性价比之王？
把Llama-3.1-8B砍掉一半参数再轻量重训，和直接从头训练一个同尺寸模型，到底谁更强？这是所有做大模型压缩和端侧部署的开发者都在追问的问题。普林斯顿大学、纽约大学和卡内基梅隆大学联合发表的这项研究给出了一个高度依赖条件的结果——答案取决于你怎么剪，以及你愿意烧多少token。
50
12种Agent记忆系统横测后，没有一种架构能通吃所有场景
复合混合系统（如A-MEM）在对话型问答上表现领先；基于知识图谱的方法在单跳事实召回上表现出色，并且对动态更新的处理最为可靠，但在处理复杂的时序推理时则显得挣扎。流式追加记录型的记忆存储，随着对话轮次和历史信息的增长，其性能会出现灾难性的退化。

← 7月1日2026-07-02

网页仅支持查询近 31 天。更早历史请通过 API（/api/v1/archive/:source?date=YYYY-MM-DD），系统按日期自动查近月表或年表。

返回首页

51CTO热榜历史归档