全部标签

新闻资讯

AI浏览代理崛起：OpenAI重磅发布新基准，揭示AI智能搜索挑战

【行客按】当你为了找一个极其冷门的问题答案，在搜索引擎的前十页疯狂翻找，却一无所获时，你是否幻想过：要是有个智能助手能帮我自动搞定该多好？如今，这一幕正在成为现实——这背后的关键技术，就是AI浏览代理（AI Browsing Agent）。近期，OpenAI团队发布了一项极具挑战性的AI浏览代理测试基准——BrowseComp，它的出现像是给AI浏览代理技术开了一场终极“高考”，吸引了全球AI研究…
前沿技术
- 4
- 0
charles25年4月14日
谷歌 AI Agent-to-Agent 让AI像人类一样交流协作

昨天比较忙，今天下午有点时间、开始写一下。上周的时间，谷歌正式推出了AI Agent-to-Agent（A2A）通信协议，应该说这是很重要的一步。因为AI能像人类一样无缝协作，不是随便一家公司能胜任这项工作的。想象一下，不同公司开发的AI，原本互不相识，现在却能轻松对话、协同完成任务。这对于之前来说是不可思议的事情，电商客服AI能够自动调用物流AI查询订单状态了，完全不需要人工介入或专门开发接口。…
前沿技术
- 6
- 0
charles25年4月14日
Google Deep Research VS Manus：关公战赵四

Manus官方也没有邮件提醒，反正昨天登录就可以使用了。简单测试对比了一下Google Deep Research with 2.5 Pro的同一主题的研究分析能力。给了一个很简单的任务“API访问Telegram频道内容”Manus的操作很夸张，它是直接起了一台ubuntu虚拟机，然后在sandbox里面完成所有的操作，包含控制浏览器和调用命令行工具。只能说这波太秀了，脑洞大开。然后是内容的获取…
前沿技术
- 3
- 0
charles25年4月13日
【阿里云百炼推出MCP市场】高德地图MCP + Qwen Max构建AI应用，找公共厕所变得如此轻松

什么是阿里云百炼？阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。它面向开发者和业务人员，让所有人都能参与到大模型应用的设计与构建中。通过其简洁的操作界面，用户轻松完成大模型应用的开发，以及专属模型的训练。百炼支持MCP啦！随着MCP协议的发展，越来越多的云计算平台开始推出MCP托管服务。作为统一大语言模型访问外部资源与工具接口的开源协议，MCP受到开源社区的巨大关注。近期我也发布了…
前沿技术
- 2
- 0
charles25年4月13日
洞穴之外的星辰：AI时代的认知边疆

AI既是一面照出我们认知局限的镜子，也可能成为锻造新认知维度的熔炉。大语言模型是非物理空间的智能，而物理空间数据通过人类语言实现理解与表达，这种区分物理与非物理智能关系，主要是集中在语言理解与使用中，这也是人类文化创造与积累的前提，正是在这种前提下，我们是整体上被大语言模型困在里面，而多模态的理解，也是语言式的理解路径。从这个绝对意义上看，认知与想象力都不过是语言泛化而已，究竟如何重新评估未来AI…
前沿技术
- 3
- 0
charles25年4月13日
我也曾一上来就想实现大模型的极限目标，原来那时候真的还没入门！

在AI技术迅猛发展的今天，AI产品的创新不再仅仅取决于技术的先进性，而更在于如何精准匹配市场需求。我们经常看到，一些AI产品在实验室阶段表现惊艳，但真正推向市场后却无人问津。究其原因，核心问题在于：如何为AI产品找到恰当的应用场景，让技术不只是炫技，而是真正创造价值？AI产品的落地并非简单的“技术驱动”，而是模型、技术、场景和商业模式的融合。在AI产品经理的视角下，我们需要系统性地评估模型的能力边…
前沿技术
- 5
- 0
charles25年4月13日
万字长文深入浅出文本嵌入（Text-Embedding）技术

一、文本嵌入（Text-Embedding）技术快速入门第一部分是快速入门，第二部分是深入学习文本嵌入技术，请耐心往下读！1. Text-Embedding 技术概述Text-embedding 技术是一种将文本数据转换为向量的技术，通过深度学习模型将文本的语义信息嵌入到高维向量空间中。这些向量不仅能表达文本内容，还能捕捉文本之间的相似性和关系，从而让计算机高效地进行文本检…
前沿技术
- 7
- 0
charles25年4月13日
MCP配置难？阿里云百炼直接砍掉配置门槛，开箱即用！

这是用firecrawl MCP+Flomo MCP实现灵感的快速捕捉：这是用高德地图MCP实现约会地点的高效挑选：以上对MCP的调用，都是借助阿里云百炼的MCP服务在5分钟内实现的，不用经历Cursor那种繁琐的配置。要更好地理解百炼MCP服务的价值，我们就需要理解MCP为何而来，所以今天这篇文章，我会分为以下三个部分进行展开，分别是：MCP的由来&价值百炼MCP服务解决的问题MCP智能…
前沿技术
- 6
- 0
charles25年4月13日
我宣布 Grok3 的 API 是最好的大模型接口服务

通过之前的推送《? xAI 超值福利！充 5 美金每月送 150 美金 API 额度！?》已经拿到了 Grok 的 API，最近 Grok3 模型也支持使用 API 调用了。Grok 3 的 API 很多，各自的特性如下：- Grok 3 beta 专业知识+不思考- Grok 3 beta fast 专业知识+更快速+不思考- Grok 3 mini beta 非专业知识+思考- Grok 3 …
前沿技术
- 9
- 0
charles25年4月13日
详解A2A(Agent2Agent)协议

什么是 A2A 协议A2A（Agent2Agent）协议是由 Google Cloud 推出的一个开放协议，旨在促进不同 AI 代理之间的互操作性。其主要目标是允许这些代理在动态的、多代理的生态系统中进行有效的通信和协作，无论它们是由不同的供应商构建的还是使用不同的技术框架。A2A 的设计原则总结A2A（Agent2Agent）协议的设计原则旨在提升代理之间的协作能力，确保灵活性、安…
前沿技术
- 4
- 0
charles25年4月13日
大模型的游戏规则：不是术业有专攻，而是底座定生死

近一年，AI领域涌现出一股“专业化”的潮流——医疗大模型、教育大模型、法律大模型……仿佛只要在某个垂直行业加上“大模型”三个字，就能立刻拥有技术护城河、资本热捧和市场话语权。但真的是这样吗？在越来越多的实践和案例面前，答案似乎正逐渐显露：那些专注做“专业模型”的公司，可能正在走一条注定艰难甚至错误的道路。大模型不是“模块”，而是“底座”大模型最大的特点是什么？不是某一个功能特别强，而是底层能力极其…
前沿技术
- 2
- 0
charles25年4月13日
AI大模型如何存储海量数据？一文读懂数据重删和数据压缩

随着人工智能技术的飞速发展，大语言模型（LLMs）已成为自然语言处理领域的核心力量，展现出强大的语言理解和生成能力。然而，LLMs的开发与部署面临着巨大的数据管理挑战，包括数据收集、治理、存储和优化等多个方面。AI对存储的需求几乎涵盖所有方面：高性价比的容量、高可用性、高可靠性、高IOPS、高吞吐量和安全性。更具挑战的是，AI流水线的不同阶段对存储性能也提出各异且动态变化的要求。简而言之，在满足上…
前沿技术
- 5
- 0
charles25年4月13日
来了！10个构建Agent的大模型应用框架

随着生成式人工智能（GenAI）的蓬勃发展，基于大型模型的应用已经悄然融入我们的日常工作和生活，它们在诸多领域中显著提升了生产力和工作效率。为了更便捷地构建这些基于大模型的应用程序，开源社区和产品开发者们正以前所未有的速度进行创新。在这些创新中，面向智能体（Agent）的应用，即所谓的Agentic AI，已经崭露头角，成为近年来生成式AI系统中最具潜力的明星。众多构建智能体应用的框架如雨后春笋般…
前沿技术
- 5
- 0
charles25年4月13日
一文读懂MCP：从入门到精通的完整指南

这是一篇关于MCP的深入指南。在本文中，我们将全面解析MCP（Model Context ProtocolProfessional）的核心概念、认证价值以及如何从零开始规划你的学习和考试路径。无论你是刚接触IT行业的新人，还是希望提升技能的资深从业者，MCP认证都能为你的职业发展提供坚实的技术支持和更广阔的职业机会。接下来，我们将从MCP的定义和重要性入手，为你揭开这一认证体系…
前沿技术
- 4
- 0
charles25年4月13日
微软突发“封杀令”！全面禁止Cursor使用C、C++、C# 扩展，开发者被迫回退版本

微软某个 VSCode 语言服务扩展中，位于 nativeStrings.json 文件第 485 行的一行代码，打破了它与 Cursor 的兼容性。该条款规定：“C/C++ 扩展仅可与 Microsoft Visual Studio、Visual Studio for Mac、Visual Studio Code、Azure DevOps、Team Foundation Server 以及微软后…
前沿技术
- 4
- 0
charles25年4月13日
继续卷，Google 发布AI 编程工具 Firebase Studio

各位好，我是风筝该卷的总会卷的，这一两年AI编程工具层出不穷，Cursor、WindSurf、Trae，以及各种辅助编程插件都在不遗余力的争夺市场。但一直都没看到Google下场，正如Google在其他AI领域的行事风格一样，低调。这不，Google 也下场来卷了。这两天Google发布了全新AI编程平台Firebase Studio。Firebase Studio是 Google Firebas…
前沿技术
- 3
- 0
charles25年4月13日
DeepSearch：AI 搜索的未来，不止于快

你是否知道，AI 从业者平均每天要花费数小时在信息检索上？搜索的低效，正在成为 AI 创新的绊脚石。想象一下，如果你的 AI 实习生能像专家一样帮你调研并整理高质量的研究报告，并自主判断报告的质量，效率提升 10 倍不再是梦！今天，让我们一起揭秘 Jina AI DeepSearch，看看它如何打破搜索瓶颈，赋能 AI 报告生成！注：本篇文章由我基于JINA AI 肖博士现场演讲的笔记+ 2句…
前沿技术
- 3
- 0
charles25年4月13日
谷歌Agent Development Kit核心概念以及与其它框架的横向对比、适用场景总结与建议

一、端到端的全流程设计它融入很多框架不曾涉及的概念1、智能编排系统灵活工作流引擎• 支持两种编排模式：预设式流水线：通过工作流代理（Sequential顺序执行/Parallel并行执行/Loop循环执行）构建确定性流程动态路由系统：基于LLM驱动的智能决策（LlmAgent转移机制）实现自适应行为流2、多智能体架构模块化协作体系• 采用分层组合架构：通过多个专业化Agent的层级组合构建可扩展应…
前沿技术
- 4
- 0
charles25年4月13日
GPT-4 官宣退役！曾经的最强模型，正式交棒 GPT-4.1、o3、o4 mini！

4月的 AI 圈，注定不平静。4 月 10 日，OpenAI 一纸公告，把不少 ChatGPT Plus 用户的 “老伙计” 打包送走：GPT-4 将于 4 月 30 日从 ChatGPT 中正式下线，由各方面都更强的 GPT-4o 全面替代。官方原话：“GPT-4o 在写作、编程、STEM 等方面「全面超过 GPT-4」，已经足以承担 “继承者”…
前沿技术
- 3
- 0
charles25年4月13日
里程碑，GPT-4.5大模型正式通过图灵测试！

重要里程碑事件！近日来自加州大学圣迭戈分校的研究学者首次提供了人工系统（LLaMa-3.1-405B 和 GPT-4.5）通过标准三方图灵测试的实证证据。GPT-4.5 被判断为人类的比例高达 73%，显著高于真实人类参与者被选中的比例。LLaMa-3.1 在相同提示下被判断为人类的比例为 56%，与人类参与者没有显著差异。图灵测试由艾伦·图灵在 1950 年提出，用于判断机器是否能够表现出与人类…
前沿技术
- 4
- 0
charles25年4月13日
OneEval：OpenKG发布大模型知识增强综合能力评测榜单

OpenKG.SIGEval大模型知识增强系统评测-OneEval官网：http://oneeval.openkg.cn/1. 引言OneEval 是由OpenKG发起并组织的中立、公益、专业的大模型评测榜单。区别于多数聚焦于“LLM”基础能力评测的现有榜单，OneEval 更加侧重于“大模型 + 知识库（LLM+KB）”的融合能力评估，重点考察知识增强驱动下大模型的慢思维能力（即模型在复杂问题上…
前沿技术
- 8
- 0
charles25年4月13日
浅谈大模型安全

什么是大模型安全？大模型安全，简而言之，就是确保大模型从训练到应用的整个过程都是安全的。这涉及数据安全、模型安全、应用安全、系统安全、内容安全等多个领域，且这些领域相互交叉。关于大模型安全的框架，目前业界尚未形成统一的标准。行业视角：大模型安全框架中国信通院从对象视角出发，将大模型安全分为数据安全、模型安全、系统安全、内容安全、伦理安全、认知安全等几个方面[1]。阿里云联合中国信息通信研究院等30…
前沿技术
- 7
- 0
charles25年4月13日
浅谈大模型时代的谣言治理：挑战、对策与中外实践对比

00—引言在大模型广泛应用的背景下，谣言传播迎来了新的挑战和风险。一方面，社交媒体和通信平台上的虚假信息早已是全球性难题，新冠疫情期间就出现“信息疫情（Infodemic）”现象，80%的网民曾接触过有关疫情的假消息。另一方面，生成式AI极大降低了造谣成本，提升了造假逼真度。过去人工杜撰假消息往往漏洞百出，而现在大模型可以“专业”地编写包含完整5W要素的假新闻并自动生成逼真的配图，使得谣言更具迷惑…
前沿技术
- 3
- 0
charles25年4月13日
AI法规-《生成式人工智能服务管理暂行办法》（中国）（2023.7）

中国首部针对生成式AI的部门规章，明确数据安全、内容标识、算法备案等要求。2023年7月发布，自2023年8月实施。生成式人工智能服务管理暂行办法第一章总　则第一条为了促进生成式人工智能健康发展和规范应用，维护国家安全和社会公共利益，保护公民、法人和其他组织的合法权益，根据《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技…
前沿技术
- 5
- 0
charles25年4月13日