全部标签

新闻资讯

🧠 解码大语言模型的记忆力：上下文长度的前世今生

在与ChatGPT、Claude等大语言模型对话时，你是否好奇：它们是如何记住我们之前的对话内容的？为什么有时它们能记住很长的对话，有时却会"失忆"？今天，我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度（Context Length）。上下文长度是什么？想象你正在和一个朋友聊天。这个朋友有一个特殊的能力：他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…
前沿技术
- 2
- 0
charles25年4月15日
MemInsight：结构化记忆增强，让 LLM Agent更智能

想象一下，你有一个超级聪明的AI助手，它不仅能记住你说过的话，还能理解你话里的深层含义，甚至能预测你下一步的需求。这听起来是不是很棒？这就是MemInsight想要实现的目标：通过自主增强LLM Agent智能体的记忆，让它们变得更加智能和个性化。这是不是听起来有点像记忆的魔法？在这种背景下，亚马逊AWS AI团队在Arxiv上发表了这篇极受欢迎的论文《MemInsight: Autonomou…
前沿技术
- 5
- 0
charles25年4月15日
微软论文：API Agents和GUI Agents的分歧与融合

最近AI圈子在火热的讨论API Agents、GUI Agents，关于这两者的研究很有必要阅读下近期微软发布的这篇论文《API Agents vs. GUI Agents: Divergence and Convergence》，跟着小编一起深入研究下，以下是论文完整的译文，Enjoy。简介大型语言模型 (LLM) 已从简单的文本生成发展到能够将自然语言命令直接转化为实际操作的软件代理。基于…
前沿技术
- 7
- 0
charles25年4月14日
从“人驱动”到“模型驱动”：聊聊 Agent 在 2025 年的爆发与挑战

阿里妹导读本文作者主要阐述为什么大家认为 Agent 模式会在 2025 年开始爆发，我们有了哪些进步，我们又面临了哪些挑战。随着人工智能、机器学习和自然语言处理等技术的飞速发展，Agent 技术已经从理论研究走向实际应用，展现出巨大的潜力和价值。尽管我们负责的 AI Coding 产品 Aone Copilot 在阿里集团被广泛的使用，也在每个阶段使用 AI 做了许多的探索，但长期以来我对大…
前沿技术
- 4
- 0
charles25年4月14日
MCP 正当时：FunctionAI MCP 开发平台来了！

MCP：AI 时代的“操作系统接口”Cloud Native2024 年 11 月，Anthropic 发布模型上下文协议（MCP），这一开放标准迅速引发开发者社区的"协议觉醒"。其本质是通过标准化接口实现 LLM 与外部世界的双向交互，正如 USB 协议统一外设接入，MCP 正成为 AI 应用连接数字生态的通用总线。随着 Cursor、Claude Desktop 等开发工具…
前沿技术
- 4
- 0
charles25年4月14日
MCP协议深度解读：技术创新正以前所未有的速度突破

作者：rian OpenAI 官宣全面支持MCP协议，至此MCP已得到业界广泛的认可。正逐步成为AI应用架构的基础协议。做为AI应用架构的USB-C,MCP原理是怎样的？对实际业务又有何影响呢？本文以MCP原理解读及业务实践为切入点，探索AI应用架构在业务领域落地的路径。一、技术背景大模型很长时间面临认知边界和工具使用的双重约束：其知识体系受限于预训练阶段的静态数据沉淀并缺少完成任务的工具。而…
前沿技术
- 3
- 0
charles25年4月14日
探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

LLM Agents 作为一个新兴且极具潜力的领域，正逐渐改变人们与技术交互的方式。本文将深入探讨 LLM Agents，重点聚焦于 ReAct 框架，剖析其原理、优势以及实际应用。一、AI Agents 的演进“Agents” 这一概念在人工智能领域并非新生事物。从早期简单的语音激活玩具到如今功能强大的数字助理，AI Agents 经历了漫长的发展历程。1916 年的 Radio Rex 是最早…
前沿技术
- 5
- 0
charles25年4月14日
MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

在当今构建 AI 应用的过程中，Function Calling、MCP 以及 AI Agent 是三个密切相关但层级分明的概念。理解它们的区别与联系，对于开发者设计合适的 AI 系统至关重要。我们可以把这三者类比为“调用指令 → 调度系统 → 自主执行者”，分别解决不同层级的问题。Level 1：Function Callin…
前沿技术
- 4
- 0
charles25年4月14日
有了MCP，还需要深入研究Agent吗？

作为连接大模型和工具的通用协议，MCP让用户可以有机会将自己正在使用的大模型，与全世界优秀的软件连接，从而，可以在类似ChatGPT之类的聊天类应用中，完成智能的任务处理（期间调用工具来实现特定目的）。当我们在聊天界面中，连接了工具体系时，可能会有一个疑问：这几乎和我们接触的智能体并无二致，我们还有必要深入研究Agent技术吗？今天，我想聊一聊这个问题，并结合自己的实际落地场景，来聊一聊未来可能的…
前沿技术
- 3
- 0
charles25年4月14日
大模型备案详解：哪些企业需要备案？如何高效准备？

最近接触很多央国企的客户，对大模型备案存在很多疑惑。特此梳理了下近期高频遇到的问题，整理成文。问题一：什么是大模型备案？大模型备案是指大模型产品在向公众开放及商用之前，经过国家互联网信息办公室（简称“网信办”）等监管部门的备案审批过程。问题二：什么情况下需要做大模型备案？《生成式人工智能服务管理暂行办法》第十七条和第二十二条的要求，提供具有舆论属性或者社会动员能力的生成式人工智能服务的企业都需要做…
前沿技术
- 3
- 0
charles25年4月14日
大模型量化技术：主流方法解析与代码实践

随着大模型参数规模突破万亿，如何高效部署成为关键挑战。量化技术通过将高精度浮点数转换为低比特整数，显著减少模型存储和计算开销。本文详解5种主流大模型量化方法，涵盖作用、架构与创新点，并提供公式与代码示例，助你快速掌握核心技术。一、量化技术的作用与分类核心作用：压缩模型体积：例如，将7B参数的FP32模型（28GB）量化为INT8（7GB），体积减少75%。加速推理：低精度整数运算速度远超浮…
前沿技术
- 1
- 0
charles25年4月14日
面向 MoE 和推理模型时代：阿里云大数据 AI 产品升级发布

阿里云 2025 AI 势能大会上，阿里云智能集团副总裁、阿里云智能计算平台事业部负责人汪军华带来主题演讲《范式演进：MoE&推理模型时代的挑战与应对》，并发布大数据 AI 平台一系列重磅产品能力升级。汪军华认为，从 Generative AI 发展到今天的 Agentic AI，大模型能完成越来越多的逻辑推理和规划任务。未来，AI 需要与业务数据平台做打通和连接，打破与物理世界的边界，…
前沿技术
- 6
- 0
charles25年4月14日
告别安装，我挖到了网页版Cursor（附4大AI编程新场景）

作为一个 Cursor 常年订阅用户，我原以为 Trae 免费的 Claude3.7、DeepSeek-V3-0324 已经够香了，除了日常代码开发外，做一些自己急需的小工具，告别烦人的使用次数限制和广告，用可视化页面取代PPT等等。虽然大模型们码力十足，但是当我安利的时候还是会遇到一个问题：有没有将生成、部署、分享、二次修改等等工作流都集中在一起的平台，跳过Cursor、Trae等需要代…
前沿技术
- 6
- 0
charles25年4月14日
AgentAI | 大语言模型（LLMs）助力生成式仿真模拟

一、LLMs 为何成为仿真模拟的新宠儿LLMs 的出现，为基于智能体的仿真模拟带来了质的飞跃。传统的基于智能体的建模方法，在模拟复杂的人类行为和交互时，常常显得力不从心。而 LLMs 凭借其强大的语言理解和生成能力，以及类似人类的推理和学习能力，能够让智能体在模拟环境中展现出更加真实和复杂的行为。在传统方法中，智能体的行为往往基于预设的规则或简单的机器学习算法，难以捕捉到人类思维的灵活性和多样性。…
前沿技术
- 6
- 0
charles25年4月14日
解秘阿里 AI 战略：从未发布，但已开始狂奔

2025 年春节，整个中国科技圈估计都没过踏实。DeepSeek 以所有人意想不到的方式，掀翻了大模型产业的桌子。虽然这已经是几个月前的事情了，但这件事的连锁反应影响深远。公众和媒体更多在关注创业公司，比如「AI 几小龙」们的变化，但其实给国内「大厂」们带来的冲击同样巨大。比如百度开始悄悄调整为开源模型的策略、取消文心的订阅费，集成 DeepSeek-R1 进一步发力「搜索」这个根基业务；比如腾讯…
前沿技术
- 3
- 0
charles25年4月14日
Google Cloud Next 2025：AI 如何重塑云计算的未来（万字长文）

“ 在 2025 年的 Google Cloud Next 大会上，Google 展示了一系列令人瞩目的 AI 创新，从低延迟的 Gemini 2.5 Flash 模型到突破性的音频生成工具 Chirp 3，再到企业级文本到音乐模型 Lyria，这些技术正在重新定义云计算的未来。与此同时，Google 还推出了强大的智能体生态系统和基础设施升级，包括 Ironwood TPU 和 AI …
前沿技术
- 4
- 0
charles25年4月14日
IBM放出『PDF灭霸』:2.56亿参数屠榜文档AI

SmolDocling基于 Hugging Face 的 SmolVLM-256M 构建，该模型在参数数量上比同类文档理解任务调整的视觉-语言模型小 5 到 10 倍。视觉骨干采用 SigLIP base patch-16/512（93M）其训练数据经过重新平衡，以强调文档理解（41%）和图像描述（14%）。通过增加像素到标记的比率至每标记 4096 像素，并引入子图像分隔符的特殊标记，提高了标记…
前沿技术
- 4
- 0
charles25年4月14日
为什么Multi-Agent多智能体系统终将失败？（伯克利论文）

研究背景研究问题这篇文章要解决的问题是多智能体大语言模型（LLM）系统（Multi-Agent LLM systems，简称MAS）在性能上与单智能体框架相比提升甚微的原因。尽管MAS在处理复杂多步骤任务和与不同环境动态交互方面具有潜力，但在流行基准测试中其准确性或性能的提升仍然有限。研究难点该问题的研究难点包括：如何全面分析阻碍MAS有效性的挑战；如何确定导致MAS失败的多种故障模式；如何提出有…
前沿技术
- 5
- 0
charles25年4月14日
现在评测集太简单了，OpenAI 推出深度搜索评测新基准 BrowseComp

OpenAI 昨日除发布了个人记忆功能外（谜底揭晓！ChatGPT记忆功能全面升级，您的专属ChatGPT上线），还宣布推出并开源 BrowseComp，一项全新且极具挑战性的基准测试。该基准旨在精准衡量智能体在互联网上定位极端难以查找信息的核心能力，以此应对当前评估方法的显著不足。随着 AI 智能体日益依赖网络浏览获取知识，评估其深度挖掘和综合信息的能力变得至关重要。现有基准（如 SimpleQ…
前沿技术
- 17
- 0
charles25年4月14日
从明天开始，OpenAI将发布大量新产品

今天凌晨2点半，OpenAI联合创始人兼首席执行官Sam Altman发文表示，在接下来的这一周，将发布很多精彩的产品。从明天就开始，（也就是北京时间的周二）。根据OpenAI首席财务官Sarah Friar透露，OpenAI正在研发一款超强的Agent编程产品A-SWE。与传统的开发AI助手不同的是，A-SWE 可以构建应用程序、处理拉取请求、进行质量保证、修复错误和编写文档。应该和当…
前沿技术
- 6
- 0
charles25年4月14日
智能体互联网不等于多智能体协作：MCP、ANP与A2A的网络效应分析

1 智能体作为网络节点有人把智能体比作互联网上的网站。诚然，未来每个智能体都可注册独一无二的身份并提供可访问性。然而，智能体不再是被动等待访问的信息页面，而是善于主动出击、调用工具、帮助委托人完成意图的行动者。网站间通过超链接静态互联，而智能体间通过行动动态互联。这是Agentic Web与Web的根本不同。这种动态互联会如何发生呢？一种情形是消费者行为的变化会驱动供给侧变革。比如，个人财务助手帮…
前沿技术
- 4
- 0
charles25年4月14日
看完这10张动图，我终于理解MCP的原理了！它和API不一样！

关于模型上下文协议 (MCP) 的讨论层出不穷，今天我们来了解一下它到底是什么。从直觉上看，MCP像是AI应用的USB-C接口。正如USB-C提供了一种标准化的方式，将设备连接到各种配件，MCP则标准化了AI应用与不同数据源和工具的连接方式。让我们从技术角度稍微深入探讨。MCP的核心是基于客户端-服务器架构，主机应用程序可以连接到多个服务器。它有三个关键组成部分：主机（Host）客户端（Clien…
前沿技术
- 9
- 0
charles25年4月14日
永别了，GPT-4！

【导读】GPT-4时代，落幕了！它将被GPT-4o完全取代。而下周，我们也极有可能迎来GPT-4.1、o3满血版以及o4-mini这些新模型。大模型进化史，再次迎来关键节点。猝不及防地，GPT-4就这样退出历史舞台了。4月10日，OpenAI正式宣布，即将从ChatGPT中移除两年前推出的GPT-4。从4月30日起，GPT-4将被当前的默认模型GPT-4o完全取代。当然，怀念GPT-4的用户们也不…
前沿技术
- 5
- 0
charles25年4月14日
GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

上线仅三天的神秘模型，已经鲨疯了！大模型聚合平台OpenRouter新推出的Optimus Alpha，已经处理了772亿Token，平均每天超过200亿。并且这个数字还在上升，日Token处理已超过340亿，排名第二，并在Trending榜单上位列第一。有网友试着用它挑战MC-Bench，生成《我的世界》风格的场景，并对比了4o-mini，结果高下立判：还有人系统测试了它的编程水平，发现Opti…
前沿技术
- 5
- 0
charles25年4月14日