-
CAG 与 RAG:哪种方法能带来性能更好的人工智能
在我们上一篇文章中,我们探讨了缓存增强生成(Cache-Augmented Generation, CAG),解释了它是什么、如何工作,以及它为何正在重新定义大语言模型(LLMs)的效率。但 CAG 并非唯一选择,它的 “对手”—— 检索增强生成(Retrieval-Augmented Generation, RAG),在 CAG 可能不足的领域大放异彩。这两种方法各自代表了优化人工智能性能的不同…- 1
- 0
-
大语言模型引擎全解析:Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama
本文将带你深入了解 Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama 这些引擎,帮助你找到最适合的工具,释放大语言模型的全部潜力! 一、Transformers 引擎:NLP领域的全能王者 开发者:Hugging Face 核心特色:作为当下最炙手可热的开源NLP库,Transformers堪称NLP领域的“瑞士军刀”,它支持数百种预训练模型,涵盖GP…- 2
- 0
-
10种顶级 AI Agent 策略全解析:ChatGPT 智能应用开发必备指南
随着 ChatGPT 等大语言模型的普及,AI Agent 已成为下一代 AI 应用的核心。本文深入浅出地介绍 Agent 策略模式,帮助你理解如何选择和应用不同的 Agent 架构,打造更智能的 AI 应用。AI 工具中的 Agent:从理论到实践 如今,Agent 技术已经从实验室走向实际应用,各大科技公司纷纷推出了自己的 Agent 产品: • Coze:字节跳动推出的低代码 Agent 开…- 2
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 2
- 0
-
王炸!微软AI Agent支持A2A、MCP协议,智能体黄金时代降临
今天凌晨,微软在官网宣布Azure AI Foundry和Microsoft Copilot Studio两大开发平台,支持最新的Agent开发协议A2A。 这也是微软支持MCP后又一关键动作,并且会与谷歌合作一起开发扩大A2A协议,这对于智能体赛道来说意义重大。因为智能体在使用A2A、MCP协议之后,可以打破数据、开发模式、通信交互、操作环境等诸多壁垒,轻松构建超大规模的复杂智能体自动化流程。 …- 1
- 0
-
一文带你搞懂AI大模型技术版图
从2022年11月ChatGPT的问世,到现在已经两年有余,AI大模型相关技术在不断的发展,相关的AI智能产品也在不断走向成熟。 不论你是想开发更智能的App辅助自身工作,还是希望不被技术浪潮淘汰,学习AI都像学用电脑一样正在变成必备技能。别被“人工智能”四个字吓到,其实它就像学做菜:掌握几样核心原料(数据),了解常用厨具(算法),再练几道招牌菜(应用场景),你也能用AI做出让人惊叹的“数字料理”…- 2
- 0
-
大模型与安全|第一弹:AI防口误指南之LLM输出安全实践
在数字化转型的浪潮中,大语言模型(以下统称LLM)已成为企业技术栈中不可或缺的智能组件,这种强大的AI技术同时也带来了前所未有的安全挑战。它输出的内容如同双面刃,一面闪耀着效率与创新的光芒,另一面却隐藏着"幻觉"与不确定性的风险。此类"高度自信的错误"比明显谬误更危险,因为它们伪装成可靠信息,传统信任模型在面对高度智能化的AI系统输出时,正面临着严峻的适应性…- 2
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
从RAG到CoT再到MCP,一文读懂AI Agent落地难题|大模型研究
「 智能体现在还堪堪能用! 」生成式AI已经以前所未有的速度改变着我们的数字世界,从ChatGPT到Midjourney,从Claude到Gemini,这些大型语言模型展现出了惊人的能力。然而,当我们试图将这些模型从简单的对话工具转变为能够自主决策和执行任务的智能体(AI Agent)时,一系列复杂的技术难题开始显现。 现实总是与理想相差甚远,你以为基于大模型灌入自有数据就能快速定制一个好用的智能…- 1
- 0
-
蚂蚁集团基于 Ray 构建的分布式 AI Agent 框架
导读本文将分享蚂蚁最新的基于 #Ray 的分布式 #Agent 框架,Ragent。 主要内容包括以下几个部分: 1. Background2. Motivation3. Design & Impl.分享嘉宾|陈齐翔 蚂蚁集团 软件工程师、Ragent 框架主要作者编辑整理|王甲君内容校对|李瑶出品社区|DataFun相信很多人都了解 Ray,它是 OpenAI 用于大模型训练的底层分布式…- 2
- 0
-
AI Agent“虚火”过旺,或沦为“假Agent”?
如何定义 AI Agent?如何看待 AI Agent 领域存在的过度炒作现象?如何找到 AI Agent的最佳切入点?哪些关键 KPI 可以验证 AI Agent 项目的实际业务价值?在崔牛会策划的“DeepTalk|DeepSeek猜想系列”对话中,由崔牛会创始人&CEO 崔强主持,邀请了 Gartner 公司副总裁孙鑫(Julian Sun),围绕“真假 …- 1
- 0
-
AI编程模型领域迎新王?谷歌发布Gemini 2.5 Pro I/O,单条文本提示即可生成完整应用
5月7日消息,美国当地时间周二,谷歌DeepMind人工智能研究团队发布了Gemini 2.5 Pro “I/O” ,这是今年3月发布的多模态大语言模型Gemini 2.5 Pro的升级版本。DeepMind CEO德米斯·哈萨比斯表示,这是“我们有史以来构建的最强编程模型!”从谷歌公布的初步基准测试结果来看,哈萨比斯并非夸大其词。自从2022年底ChatGPT引爆生成式AI热潮以来,谷歌首次在关…- 2
- 0
-
用AI把一段视频变成可视化网页,Google的新模型又卷飞了。
Google也不知道受了什么刺激,最近在AI场上,好像越来越有站起来的意思了。之前我就写过Gemini 2.5 pro,是在聊天记录可视化的文章里。全世界,只有Gemini 2.5 pro,能吃下一个每天999+微信群聊天记录的上下文,同时还能给你干出,一个还挺好看的可视化网页。在Qwen3的跑分中,也印证了,Gemini 2.5 Pro的能力也是真的强。而我自己在是日常使用中,也几乎是把Gemi…- 0
- 0
-
忽视小模型和知识库,企业AI应用必将是死路一条
2022年,ChatGPT的出现让很多人惊呼“通用人工智能时代来了”!如今一转眼三年过去了,人工智能的热潮还在,但是在实际的生产生活中,人工智能的应用到底发展得怎么样了呢?是真的已经迈入了通用人工智能时代,还是说浮华之下仍是一地鸡毛呢?个人认为,大模型和通用人工智能的普及确实开始改变人们一部分的行为方式,但是远未达到真正意义上“智能”的门槛,甚至是不是代表了人工智能未来发展的正确路径都比三年前更值…- 2
- 0
-
探讨如何构建具有可扩展长时记忆AI Agents相关的技术实现
探讨 AI Agents 长期记忆相关的技术实现,核心在于解决大型语言模型 (LLM) 固定上下文窗口的内在限制,使其能够在长时间、多轮次的对话中保持连贯性和一致性。缺乏这种持久性记忆能力导致 AI 代理遗忘用户偏好、重复信息并否定先前的事实。构建一个能够超越有限上下文窗口的鲁棒 AI 记忆系统,需要选择性地存储重要信息、整合相关概念并在需要时检索相关细节,这模仿了人类的认知过程。(底层…- 3
- 0
-
周天虹 招商银行首席信息官:大语言模型3大突破、4个影响
当前我们正处于人工智能的浪潮中,其主角是大语言模型。大语言模型实现了人工智能专业领域70多年来三个方面的重大突破:一是,实现了非常强大的自然语言的理解和生成的能力,大语言模型和人类交流,在用自然语言这件事上,已经很难区分出它是机器还是人了。二是,大语言模型具备强大的非结构化数据的理解和生成能力,非结构化数据包括文本、图像、语音、视频等,其中最强的是文本。人类几千年的文明,积累了大量的知识,以前信息…- 1
- 0
-
NVIDIA紧追Qwen3:首发Nemotron高效推理模型技术报告
英伟达发布 LLama Nemotron系列模型,能够在推理模式和普通聊天模式之间动态切换,以适应不同的任务需求。Llama-Nemotron关键技术解读神经架构搜索(NAS)块级局部蒸馏:从 Llama 3 指令模型出发,Puzzle 框架对每个替代子块进行独立并行训练,使其在保持父块功能的同时提高计算性能,如降低延迟、内存使用或提高吞吐量。例如,对于 LN-Ultra 模型,从 Llama 3…- 1
- 0
-
一文实测Gemini 2.5 Pro:视频驱动的代码生成,打造交互式开发应用新范式
5月6号,五一假期之后的第一天,Google发布了最新的模型Gemini 2.5 PRO预览版。根据谷歌官方的描述,在代码能力、多模态能力方面显著增强,特别是交互式 Web 应用程序,也就是说,现在你可以用这个模型去做各种动态网页,甚至可以直接复刻。优势主要体现在前端和 UI 开发、基本编码任务以及创建Agent工作流。本次测评主要聚焦于编程、推理能力以及多模态理解能力方面。一、编程能力非常善于处…- 2
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 6
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
彻底搞懂 MCP 是什么、和 API 的区别、对企业的价值,如何在企业落地、未来趋势
?之前有朋友问我的文章里AI生成的内容占比多少,我自己粗略评估了一下不到20%(我主要用 AI 查资料)。 我的写作风格偏口语化,许多内容是讲我的个人理解和感悟,还会配一些自己设计的插图,所以 AI 暂时还没法替我生成很多东西。 但换个角度来想,我很低产啊? 今天来聊聊最近很火的 MCP?。本文将从企业落地的视角(而不是技术视角)去介绍MCP,希望能帮助大家彻底搞懂几个问题: MCP 是什么? M…- 3
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页
联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!