-
🧠 解码大语言模型的记忆力:上下文长度的前世今生
在与ChatGPT、Claude等大语言模型对话时,你是否好奇:它们是如何记住我们之前的对话内容的?为什么有时它们能记住很长的对话,有时却会"失忆"?今天,我们就来深入浅出地剖析大语言模型中的一个关键概念——上下文长度(Context Length)。上下文长度是什么?想象你正在和一个朋友聊天。这个朋友有一个特殊的能力:他能记住你们之间交流的最后N个字。如果你们的对话超过了N个…- 4
- 0
-
从 Workflow 到 AI Agent:对话式系统架构的演进路径
AI Agent 很热,但许多团队在真正落地时,发现它并不是灵药。一套纯 Agent 架构往往缺乏边界感、不可控,也难以与已有系统整合。于是,我们开始思考,如何以更务实的方式搭建一个结构清晰、执行稳定的智能系统。我们发现:以 workflow 为起点进行 Agent 化演进,是很多团队更实际、也更高效的路径。它提供了秩序感,也提供了技术与业务之间的缓冲带。01 - 为什么从 workflow 出发…- 4
- 0
-
文本处理专用模型:Qwen3 Embedding 和 Reranker 详解
Qwen3 Embedding 和 Reranker 是阿里巴巴通义实验室推出的文本处理专用模型,两者协同工作可显著提升信息检索的精度和效率。以下从核心功能、技术原理、应用场景及性能表现展开详细介绍:🔍 一、核心功能与技术原理1. Qwen3 Embedding:语义向量化“初筛”• 功能:将文本(如句子、段落)转化为高维向量(嵌入向量),通过向量间的距离反映语义相…- 3
- 0
-
让manus从零到一的上下文工程到底是什么?一文起底
导读 在人工智能的宏大叙事中,大型语言模型(LLMs)无疑是近年来最引人瞩目的技术突破之一。它们凭借惊人的文本生成、理解、推理乃至代码编写能力,正在以前所未有的速度重塑各行各业的生产力格局。从最初的简单问答系统,到如今能够执行复杂任务的智能代理(AI Agent),LLMs 的每一次飞跃都伴随着与之交互方式的深刻变革。最初,为了有效驾驭这些强大的模型,研究者和开发者将目光聚焦于“提示词工…- 5
- 0
-
大模型上下文工程(Context Engineering)详解
随着大语言模型(LLM)的快速发展,从GPT-3到ChatGPT,再到Claude、GPT-4等更强大的模型,我们见证了一个重要趋势:上下文窗口的不断扩大。早期的模型可能只能处理几千个token,而现代模型已经能够处理数十万甚至数百万个token的上下文。为解决这些问题,上下文工程(Context Engineering)作为专门优化模型输入信息质量的技术体系应运而生,本文将从以下方面介绍:1. …- 4
- 0
-
埃森哲首席AI官谈智能体
智能体在整个组织内部以及各种交互场景中的应用规模正在飞速增长。企业该如何把握住这一重要的技术浪潮,将其转化为企业转型的加速器?埃森哲首席AI官关岚(Lan Guan)针对这一话题分享了让智能体真正跑起来的五个必要改变。使用过传统AI应用的人都知道,与一个理解有限、操作流程僵化的工具互动是多么困难。但随着智能体的出现,这种状况将得到大幅改善——AI将变得越来越直观和灵活,能够更精准地理解人们的需求并…- 3
- 0
-
从IMO金牌到GPT-5:OpenAI如何用一场“技术营销”重新定义AI推理?
OpenAI的一个员工连续发了11个帖子,称他们的内部实验模型已经可以拿到国际数学奥赛金牌,真是这样吗?这款模型实力到底如何?要回答这个问题,我们首先要确定一个共识:那就是像OpenAI这样的公司不管是CEO奥特曼,还是任意员工在公开社交媒体发布信息,都肯定是精心策划的具有明确目的性的商业行为。说白了,他们说话,绝不可能像普通人发个朋友圈一样,而是想要达到类似于Marketing营销的效果。第一个…- 3
- 0
-
小语言模型才是Agentic AI的未来?
分享一个Nvidia的呼吁:先说主基调:能用大模型谁还需要用小模型?就是因为大模型用不起(包括设备,延时等等)。那剩下的问题就是小模型到底能不能抗住用户的需求?作者认为,小型语言模型(SLMs)在很多场景下比大型语言模型(LLMs)更适合用于构建“代理式人工智能系统”(Agentic AI Systems),因为它们:能力足够:在许多实际任务中,小模型已经足以胜任,甚至能匹配更大模型的效果。操作更…- 3
- 0
-
为什么Perplexity要打造自有浏览器Comet?
What:AI巨头们的浏览器乱战 2025年,各大AI巨头们开始了一场新的“浏览器战争”,其核心是为了AI的深度集成与入口控制权。这场竞争的参与者几乎囊括了所有顶级的AI公司,它们不约而同地将浏览器视为AI时代的关键战场。Google:Google正全力将其Gemini模型整合进数十亿用户的Chrome浏览器,陆续推出了页面智能摘要、多标签页比较、智能镜头搜索以及非常关键…- 3
- 0
-
用Dynamic chunk去干掉tokenizer?
一般你们下AR模型的时候,都有这个,也就是tokenzier,tokenizer是干啥的,其实就是你的分词字典不光有specal的token对应的还有实际的对应的分词对应的代码,比如:也有tokenzier没显示的,比如,为什么呢?因为它不是文本模型,人家输入是声音,因为它是ASR扯远了,回归主题tokenizer之所以总是个独立的model,因为它和transformer不是一个网络,它也不参与…- 3
- 0
-
来自 Manus 的一手分享:如何构建 AI Agent 的上下文工程?
Manus 官网昨天更新了一篇文章,分享了他们为 Manus 搭建合适的上下文工程的经验教训。作者季逸超 (Peak),Manus 公司联合创始人、首席科学家。文章基于 Kimi K2 翻译,我们进行了一些调整。在 Manus 项目伊始,我和团队就面临一个关键抉择:是利用开源基础模型训练一个端到端的智能体,还是依托前沿模型的上下文学习能力,在其之上构建智能体?在我投身 NLP 的第一个…- 3
- 0
-
AI产品经理的分水岭:不是懂模型,而是懂业务+AI!如何精准定义AI场景?
如果你是一位AI产品经理,面对老板的期待、团队的疑问和客户的痛点,手握最前沿的大模型技术,却发现:模型再强,也无法直接解决业务难题。你是不是也曾陷入这样的困境——技术很牛,但落地场景却总是“差口气”?真正的分水岭不在于你懂多少算法,而在于你能不能像侦探一样,精准挖掘业务痛点,把AI变成解决问题的“超级助手”。以培训场景为例,我将带你一步步拆解:如何从业务梳理到大规模验证,找到AI的“用武之地”,打…- 3
- 0
-
AI在清华,带来这些新体验!
随着“220余门AI+课程”全面落地、学生全功能智能体学伴面向全校试用,一场由人工智能(AI)技术引领的教育革新浪潮正在清华园内奔涌,以蓬勃之势构建高等教育新范式。化工教学的“人机共生”式探究、物理课堂上的实时智能交互、环境学院贯穿学生培养全过程的学科知识引擎动态导航……清华师生正以“智慧、责任、创新”的姿态,探索人工智能时代教育的新质生产力,为“AI如何赋能学校教育教学”给出“清华答案”。AI进…- 3
- 0
-
2万字长文,九篇论文读懂大模型的前世今生
大语言模型(LLMs)彻底改变了人工智能领域,但它的发展并非一蹴而就。一系列具有开创性的研究论文提出了核心观点,才让如今的人工智能成为可能——从Transformer的诞生,到能够遵循指令、逐步推理,甚至使用外部工具的模型。在这篇文章中,我们将探索九篇对现代大语言模型影响最为深远的论文。我们会深入剖析它们提出的关键概念、为何具有革命性意义,以及它们如何影响研究和现实世界中的人工智能应用。无论你是科…- 4
- 0
-
从Deep Research到AI科学家,大模型正在重塑科研全流程
我最近一直在做Deep Research(深度研究)相关工作。昨天,我读到一篇最新的综述文章 AI4Research: A Survey of Artificial Intelligence for Scientific Research,它比较全面的总结了当前AI在科学研究领域应用的流程与关键领域。Paper: https://arxiv.org/pdf/2507.01903Proje…- 3
- 0
-
打造成功 AI 产品的五条潜规则
在 AI 创业者群体中,Chris Pedregal 是一个值得关注的名字。他既是 Google前产品经理,也是 Socratic 和 Granola 的创始人。在最新的一次深度访谈中,Chris 分享了他在打造 AI 产品过程中的五条隐藏规则。这些经验并非纸上谈兵,而是 Granola 在实现 70% 周留存率过程中的一线实践。作为 AI 产品经理,我们正身处一个模型高速演进、用户期待…- 4
- 0
-
LLM + Prometheus 构建智能观测中枢:迈向智能化平台工程的演进路径
一、引言:从指标监控到智能洞察,为什么企业需要“新一代可观测中枢”?随着云原生架构日益复杂,微服务、容器、Serverless、大量 API 接口等技术堆叠造成系统运行环境高度动态。平台团队已普遍采用 Prometheus、Grafana、Loki、Tempo 等主流可观测工具构建监控体系。然而,即便拥有完善的指标采集与可视化能力,企业仍面临三大难题:告警泛滥:上下游组件互相影响导致告警风暴,告警…- 4
- 0
-
提高Dify知识库检索准确率:三种模式大揭秘
摘要:在利用 dify 构建智能应用的过程中,当你在构建知识库的时候,上传文档的过程,让你选择其中一种检索模式的时候,你是否犹豫过如何选择,或者如何让 AI 精准地从海量知识中找到所需内容,从而给出准确且有针对性的回复?Dify 提供了三种不同的知识库检索模式,分布是向量检索、全文检索、混合检索,每种模式都有其独特的运行机制和适用场景。接下来,就让我们一同深入探索这三种模式,揭开它们的神秘面纱,看…- 6
- 0
-
行业落地分享:大模型在小红书推荐的应用
在 2025 年全球机器学习技术大会上,小红书推荐算法负责人严岭分享了大模型在小红书推荐系统中的应用实践,为行业带来诸多启发。小红书作为内容分享平台,拥有海量的用户和丰富多样的内容生态。如何精准地将优质内容推送给用户,一直是推荐系统的核心任务。在小红书的首页信息流中,无论是图文推荐还是视频推荐,海量的用户和丰富的内容在这里相聚。这背后意味着什么?它意味着小红书已经不仅仅是一个购物攻略平台,更是一个…- 3
- 0
-
基于Dify的RAG知识库搭建
dify 是一款开源的大模型应用开发平台,旨在帮助开发者快速构建生产级生成式 AI 应用。在Dify 本地化部署中,知识库功能是实现企业级 AI 应用的核心能力。本文介绍基于版本 1.5.1 搭建知识库全流程解析,包括以下内容:1. Dify基本概念2. Dify本地部署3. 基于Dify的知识库搭建一、Dify基本概念Dify 是一款开源的大模型应用开发平台,旨在帮助开发者快速构建生产级生成式 …- 4
- 0
-
Gemma-3n深度解析
在大模型领域快速发展的今天,经常面临一个艰难选择:要么选择小而快的模型,牺牲质量;要么选择大而准确的模型,但需要强大的GPU支持。谷歌最新推出的Gemma-3n模型,试图彻底改变这一规则。Gemma-3n不仅仅是紧凑型模型——它代表了AI架构设计的全新思路。这个仅需2-3GB显存就能运行的模型,却包含了多项革命性的技术创新,为边缘设备上的AI应用开辟了全新的可能性。核心突破:Matformer架构…- 4
- 0
-
在病历中挖出金矿:从深度学习到大型语言模型
协和有三宝:病历、图书馆和老专家。从此可看出病历对于医学实践和研究的重要价值,但是要充分挖掘出其价值着实不容易,不仅仅是数据要素确权的问题,还有诸多数据挖掘等技术和算法问题。而这篇论文《A Systematic Survey of Electronic Health Record Modeling: From Deep Learning Approaches to Large Language M…- 2
- 0
-
大数据和大模型时代的人工智能研究和应用
导读 窦德景教授在数据智能大会上分享了其加入复旦大学数据智能实验室的背景,探讨了大数据与人工智能的发展历程及两者关系,回顾人工智能历史及发展高潮,介绍大数据应用、生成式 AI 突破、大模型优缺点与产业应用,展望大模型未来与市场潜力,强调可信数据重要性,展现 AI 在各行业广泛应用及市场规模指数增长趋势。主要内容包括以下几个部分:1. 个人背景与大数据人工智能见解2. …- 3
- 0
-
一文梳理工业界大模型推荐落地经验
好久不见,今天盘点下2024年工业界大模型在搜广推上的实战落地型工作。业界工作大体分为两类:用大模型做数据和知识增强、提取表征、通过prompt将推荐转成对话驱动的任务等,本质上没有修改LLM,属于信息增强和补充方法,无法直接建模海量协同信号。修改LLM直接建模搜广推海量数据中的协同信号,对输入输出范式改造,通过预训练/微调等过程建模海量数据,让模型同时拥有通用的世界知识和垂直领域海量协同信息。是…- 3
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



















