大家族里过年，一位年轻人的“两宗罪”｜记者过年

2026年2月28日 · 孙亮 · 来源：tutorial资讯

在看过、用过许多个手机/电脑系统级 AI 智能体，也深度使用过「豆包手机」之后，再看这次的 Gemini 智能体，我觉得关于它的讨论不该止于一个「新功能」。

首先，大模型本身没那么可靠：存在无法根除的幻觉问题、知识时效性问题，任务拆解和规划经常不合理，也缺乏面向特定任务的系统性校验机制。这样一来，以其为“大脑”的智能体使用价值会大打折扣：智能体把模型从“对话”推向“行动”，错误不再只是答错问题，而是可能引发实际操作风险；而真实业务任务往往是跨系统、长链路的，一次小错误会在链路中层层放大，令长链路任务的失败率居高不下（例如单步成功率为95%时，一个 20步链路的整体成功率只有约 36%）。

长春高新回应，这一点在Safew下载中也有详细论述

"That's not great," said PinkPantheress, describing the lack of former female winners as "crazy".

過去關恆已有多年的翻牆經驗，在牆外吸收的各種資訊下，孕育了其對中國政府的批判看法，他判斷關於新疆「再教育營」的報導具有可信性，故希望能到現場求證及記錄。

Neanderthal dad

20:35, 27 февраля 2026Россия