-
NVIDIA recsys-examples: 生成式推荐系统大规模训练推理的高效实践(上篇)
引言在生成式 AI 浪潮的推动下,推荐系统领域正经历深刻变革。传统的深度学习推荐模型 (DLRMs) 虽已展现出一定效果,但在捕捉用户兴趣偏好和动态行为序列变化时,常面临可扩展性挑战。生成式推荐系统 (Generative Recommenders, GRs) 的出现,为这一领域带来了全新思路与机遇。本文将介绍 NVIDIA recsys-examples 中针对生成式推荐场景…- 8
- 0
-
大厂经验,AI Agent 的进化:从“单挑”到“群殴”
大厂经验,AI Agent 的进化:从“单挑”到“群殴”咱们今天聊一个硬核话题:AI 公司 Anthropic 最近公布了他们是如何构建 Claude 的“研究”功能的。这不仅仅是让模型能上网搜索信息那么简单,它背后是一套复杂的“多智能体系统”。说白了,就是让一群 AI“打群架”。如果你用过最新的 Claude,你可能会发现它能处理一些特别复杂的任务,比如让你“把标普500信息技术板块里所有公司的…- 8
- 0
-
苏格拉底提问教销售更好使用Deepseek
导言在我们价值销售的理念中无数次提到销售提问在需求激发和动机激发的作用,特别是上面的《晓之以理--主动连接产品与业务》一文中提到10个提问技巧。AI发展特别是Deepseep的出现改变了包括销售在内的所有行业,DeepSeek的提示词设计就是提问技巧的应用,今天我们将苏格拉底提问应用到Deepseek的使用中,将DeepSeek打造成24小时在线的“认知工程师”——通过三步提问逻辑,让AI替你完成…- 7
- 0
-
价值销售AI使用场景一:SWOT智能体
导语DeepSeek可以为我们的销售工作提供巨大帮助,我们会陆续推出具体Deepseek的应用场景,帮助销售人员快速利用AI技术开展销售工作。PEST、竞争五力和SWOT方法一直是我们在销售策略课程中的重点内容,Deepseek的深度思考能力可以帮助销售人员更好地理解和运用这三个销售策略工具,我们具体开发了一个SWOT智能体,供销售人员直接调用。本文详细介绍SWOT智能体的设计思路和实现路径。1设…- 5
- 0
-
Claude Code最佳实践:让AI真正融入开发者工作流
Anthropic最近发布了Claude Code的最佳实践指南,这标志着AI编程工具发展的一个重要里程碑。与市面上许多试图"颠覆"传统开发方式的AI工具不同,Claude Code选择了一条更务实的道路:成为开发者的得力助手,而非替代者。设计理念:低调但强大Claude Code的核心设计理念可以用四个词概括:低级别、非主观、灵活、安全。这种设计哲学创造了一个既强大又不会强制…- 9
- 0
-
DB-GPT V0.7.2 版本更新:图表组件可视化增强、支持混合搜索 、支持DeepSeek-R1-0528模型等
V0.7.2版本主要新增、增强了以下核心特性:🍀DB-GPTDashboard 饼图、表格、柱状图等图表组件可视化增强🍀知识库支持混合搜索🍀新增Chat Data模板🍀支持非结构化文档树层级检索🍀支持Qwen3 MOE🍀支持GLM4-z1llama.cpp🍀支持DeepSeek-R1-0528模型🍀支持MiniCPM4-8B模型🍀支持Qwen2.5 VL系列模型 新特性DB-GPTDas…- 6
- 0
-
还在为35岁焦虑?我找到了用 AI Agent 搞钱的最佳实践
你有没有想过,当你在做你的本职工作的时候,只需要额外提供一个想法,就可以让AI自己去给你打工赚钱。不仅可以自动生成儿童绘本...自动搭建独立网站并且部署上线...自动完成独立游戏并且部署上线...甚至自动完成深度调研并且做完ppt?只需动动嘴皮,AI就会自动拆解任务就可以轻松完成复杂的任务,而这,就是AI Agent。自从25年AI Agent 的概念一出,已经有很多人通过AI Agent来设计绘…- 7
- 0
-
从概念到实践:万字长文深度解析AI Agent的过去、现在与未来
Agent案例库" data-id="126427">前言你是否幻想过拥有一个能自主处理复杂任务的数字管家?这个梦想正随着 AI Agent的发展即将梦想成真。在人工智能快速发展的今天,我们正见证着一场技术革命。从最初的规则系统到机器学习,再到如今风靡全球的大语言模型(LLM),人工智能的发展历程充满了突破与创新。而在这个发展进程中,一个概念正日益受到关注并展现…- 5
- 0
-
一文了解:大模型「推理基准测试」及其「核心评估指标」
引言随着生成式AI和大型语言模型(LLM)的应用的普及。企业纷纷部署基于LLM的应用,如何评估不同AI服务应用的效率是一项特别重要的需求。「LLM应用部署的成本取决于其每秒能处理的请求量,同时还需满足终端用户的响应速度并保证回答的准确性」。本文将详细介绍LLM应用成本评估核心指标:吞吐量和响应延迟,旨在澄清常见指标,解析不同流行测试工具对这些指标的定义与测量差异,并讨论基准测试的关键参数。本文目录…- 9
- 0
-
刚刚!Sam Altman官宣GPT-5今夏登场:超级智能更为重要
1小时前,OpenAI首次推出官方播客节目,今天是第一集在OpenAI首次推出的官方播客节目中,Sam Altman与主持人Andrew Mayne(OpenAI前员工)进行了一场深度对话,奥特曼透露了万众期待的GPT-5的大致发布时间,还深入探讨了AGI(通用人工智能)的定义、价值5000亿美元的“星际之门”(Project Stargate)算力项目、与Jony Ive合作的AI硬…- 6
- 0
-
刚刚,Sam Altman 宣布:GPT-5 夏天内发布
OpenAI 推出官方播客第一集:Sam Altman首次透露GPT-5发布时间,还有AGI、隐私、未来。OpenAI正式推出官方播客系列,邀请塑造AI未来的关键人物进行深度对话。首期节目中,CEO Sam Altman与主持人Andrew Mayne展开了一场长达40分钟的深度访谈,涉及AGI定义、GPT-5发布时间、隐私保护、Stargate项目以及AI硬件等多个热点话题。GPT-5 今年夏天…- 10
- 0
-
Sam Altman 最新万字对谈:理想硬件形态是 AI 伴侣,就业冲击没那么可怕
今天,Sam Altman 在和他弟弟 Jack Altman 的对谈中分享了关于他对未来 5 到 10 年 AI 发展的预测与见解,谈话内容涵盖 AI 科研、人形机器人、超级智能、OpenAI 设备、供应链等话题,并对 Meta 挖人做了回应。这场兄弟对谈轻松、温情且充满洞见,也让我们看到了Sam Altman「CEO 模式」之外的另一面。讨论要点:AI 不止是「科研助手」和效率工具,更能自主发…- 5
- 0
-
YC AI 创业营第一天,Andrej Karpathy 的演讲刷屏了
Andrej Karpathy 在 YC AI 创业营的演讲火了。「我们并非处于智能体之年,而是身处智能体的十年时代。」从软件和大模型发展开始讲起,阐述了今天做软件开发需要具备什么样的技能,以及 LLM 时代,新的交互和人机关系。以及,如何真正迈向软件 3.0 时代——提示词即应用的时代。虽然官方还未发布现场视频,但 Latent Space 对推特上相关推文进行了整理,基本上整理出来了 PPT …- 6
- 0
-
GPT-5今夏突袭?Sam Altman 首次大谈 GPT-5、AGI
今天凌晨,OpenAI发布了其联合创始人兼首席执行官Sam Altman的40分钟深度专访。本次访谈技术干货很足,Altman谈到了大家非常关心的核心产品GPT-5,大概率会在今年夏天发布,但也会因为命名、安全测试、功能迭代等原因延长产品时间。也谈到了高性能的o3模型以及智能体Deep Research,这些产品对实现AGI的重要性。此外,Altman还提到了OpenAI的其他创新产品,包括Sor…- 6
- 0
-
大模型进入研发体系后,我们看到了这些变化
现在再提“AI 写代码”,很多工程师大概只会笑笑:不就是日常工具之一吗?自动补全、代码生成、快速搭建原型……几乎已经成了标配。今天我们不讨论“AI 会不会取代程序员”这类问题,而是想问一句:AI 进了我们日常开发流程之后,哪些事情真的变了?又有哪些没变?近日 InfoQ《极客有约》X AICon 直播栏目特别邀请到了 同程旅行工程效能架构师杨方伟、网易游戏高级技术经理林香鑫、百度资深研发…- 4
- 0
-
对话:AI 无法回答的问题
当大型语言模型(LLM)以前所未有的速度渗透进我们的生产与生活,一个根本性的问题浮现在所有人的面前:这项技术的核心价值究竟是什么?当机器能够完成曾经专属于人类的“认知任务”时,我们又该如何定义“思考”本身?本次,我们邀请到人工智能领域的深度观察者 Atlas,与他一同踏上了一场关于 AI 本质的思辨之旅。探寻机器能力的边界,并最终反思,那些构筑起人类智能独特性,让机器难以企及的深层能力究竟是什么。…- 5
- 0
-
突发!阿里巴巴发布大模型的开发训练与推理部署解决方案!2025
1. 大模型的开发训练与推理部署随着参数规模和网络结构复杂性的不断提升,大模型开发、训练和推理部署所面临的挑战愈发严峻,其研发依赖算法、算力和数据的综合支撑。深度学习框架及配套工具为大模型的生产和应用提供了基础支撑,涉及开发、训练、压缩、推理和服务等多个环节。此外,通过深度学习框架还可以实现与硬件的适配和协同优化,进一步提升硬件的计算和推理性能,降低大模型开发和应用的成本。1.1 大模…- 9
- 0
-
大模型训练必知的Qwen3训练经验
预训练Qwen3分别针对通用知识、推理能力和长上下文能力三步预训练;通用知识训练:4096序列长度,30T总token,119种语言和方言;该阶段主要聚焦于语言结构、语法、常识与通用世界知识的学习,为后续阶段提供强大的多语言理解与生成能力支撑。推理能力训练:4096序列长度,5T总token,学习率衰减加快,提高STEM、编码、推理和合成数据的比例;上下文长度增加:32,768序列长度,10B总t…- 8
- 0
-
Agent 创业如何落地|吴恩达提出的 5 个设计原则
在 2025 年 5 月的 LangChain Interrupt 峰会上,吴恩达(Andrew Ng)抛出了一个核心问题:Agent 系统,怎么才能在现实中真正跑起来?他没讲概念,而是带着工程视角,回到五个具体判断:Agent 要多自主?评估怎么做?工具怎么接?语音系统怎么搭?标准怎么定?这篇文章结合他的判断逻辑与 Glean、Lamini、Cognition Labs(Devin)、Reka …- 5
- 0
-
大模型应用平台架构与核心功能全景解析
在人工智能技术迅猛发展的当下,大模型应用开发平台已成为企业智能化转型的核心基础设施。这类平台通过系统化的架构设计和功能实现,将复杂的大模型技术转化为可落地的业务解决方案。本文将分析大模型应用平台的层级架构与核心功能模块,揭示其如何支撑企业构建智能化应用。一、分层架构体系解析大模型应用平台采用分层架构设计,形成从底层算力到上层应用的完整技术栈。这种分层解耦的架构模式,为不同技术背景的参与者提供了标准…- 8
- 0
-
从销售陪练AI助手看大模型产品经理的工作差异
随着AI大模型技术的快速发展和落地应用,大模型产品经理已成为科技行业炙手可热的职位之一。本文以北森系统的销售陪练AI助手产品为例,分析这一典型大模型产品的设计思路与功能实现,并以此探讨大模型产品经理与传统产品经理在工作内容与能力要求上的差异。一、大模型产品经理的崛起与AI助手产品的兴起2025年,我们正处在一个AI技术重塑所有行业的关键时间节点。大模型技术已经从最初的文本生成、代码编写等通用场景,…- 4
- 0
-
Google深夜“亮剑”!Gemini 2.5全家桶发布,直指OpenAI命门
Google深夜“亮剑”!AI界也赶着过 618 吗?!过去的一夜,可谓是热闹非凡。当大多数人还在睡梦中时,Google DeepMind 悄然投下了一枚重磅炸弹。其官方账号宣布,Gemini 2.5 Flash 与 Pro 模型正式全面开放(GA),同时,家族中最快、最便宜的新成员——Gemini 2.5 Flash-Lite 也以预览版的形式惊艳亮相。这不仅仅是一次常规的产品更新,更像是Goo…- 6
- 0
-
人工智能:AI大模型构建证券Agent全景应用
1、 证券行业的大模型1.1 证券的行业背景证券行业作为信息密集、数据驱动且高度规范化的金融服务业态,正迎来以人工智能大模型为核心的智能化转型浪潮。在行业数字化转型进入“深水区”的背景下,大模型凭借其强大的自然语言处理、知识推理与生成能力,正成为推动券商业务模式创新和运营效率跃升的关键技术力量。截至2025年初,国内至少已有16家券商完…- 6
- 0
-
Anthropic:我们如何构建多智能体研究系统
我们的研究(Research)功能利用多个 Claude 智能体,来更有效地探索复杂主题。在此,我们分享构建这一系统时遇到的工程挑战以及我们学到的经验教训。现在,Claude 具备了研究能力[1],能够横跨网络、Google Workspace 及任何集成应用进行搜索,以完成复杂的任务。这个多智能体系统从原型到产品的演进过程,让我们在系统架构、工具设计和提示工程方面学到了至关重要的经验…- 4
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页

联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!






















