-
大模型量化技术:主流方法解析与代码实践
随着大模型参数规模突破万亿,如何高效部署成为关键挑战。量化技术通过将高精度浮点数转换为低比特整数,显著减少模型存储和计算开销。本文详解5种主流大模型量化方法,涵盖作用、架构与创新点,并提供公式与代码示例,助你快速掌握核心技术。 一、量化技术的作用与分类 核心作用: 压缩模型体积:例如,将7B参数的FP32模型(28GB)量化为INT8(7GB),体积减少75%。 加速推理:低精度整数运算速度远超浮…- 1
- 0
-
面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布
阿里云 2025 AI 势能大会上,阿里云智能集团副总裁、阿里云智能计算平台事业部负责人汪军华带来主题演讲《范式演进:MoE&推理模型时代的挑战与应对》,并发布大数据 AI 平台一系列重磅产品能力升级。 汪军华认为,从 Generative AI 发展到今天的 Agentic AI,大模型能完成越来越多的逻辑推理和规划任务。未来,AI 需要与业务数据平台做打通和连接,打破与物理世界的边界,…- 1
- 0
-
告别安装,我挖到了网页版Cursor(附4大AI编程新场景)
作为一个 Cursor 常年订阅用户, 我原以为 Trae 免费的 Claude3.7、DeepSeek-V3-0324 已经够香了, 除了日常代码开发外,做一些自己急需的小工具,告别烦人的使用次数限制和广告,用可视化页面取代PPT等等。 虽然大模型们码力十足,但是当我安利的时候还是会遇到一个问题: 有没有将生成、部署、分享、二次修改等等工作流都集中在一起的平台,跳过Cursor、Trae等需要代…- 3
- 0
-
AgentAI | 大语言模型(LLMs)助力生成式仿真模拟
一、LLMs 为何成为仿真模拟的新宠儿LLMs 的出现,为基于智能体的仿真模拟带来了质的飞跃。传统的基于智能体的建模方法,在模拟复杂的人类行为和交互时,常常显得力不从心。而 LLMs 凭借其强大的语言理解和生成能力,以及类似人类的推理和学习能力,能够让智能体在模拟环境中展现出更加真实和复杂的行为。在传统方法中,智能体的行为往往基于预设的规则或简单的机器学习算法,难以捕捉到人类思维的灵活性和多样性。…- 3
- 0
-
解秘阿里 AI 战略:从未发布,但已开始狂奔
2025 年春节,整个中国科技圈估计都没过踏实。DeepSeek 以所有人意想不到的方式,掀翻了大模型产业的桌子。虽然这已经是几个月前的事情了,但这件事的连锁反应影响深远。公众和媒体更多在关注创业公司,比如「AI 几小龙」们的变化,但其实给国内「大厂」们带来的冲击同样巨大。比如百度开始悄悄调整为开源模型的策略、取消文心的订阅费,集成 DeepSeek-R1 进一步发力「搜索」这个根基业务;比如腾讯…- 1
- 0
-
Google Cloud Next 2025:AI 如何重塑云计算的未来(万字长文)
“ 在 2025 年的 Google Cloud Next 大会上,Google 展示了一系列令人瞩目的 AI 创新,从低延迟的 Gemini 2.5 Flash 模型到突破性的音频生成工具 Chirp 3,再到企业级文本到音乐模型 Lyria,这些技术正在重新定义云计算的未来。与此同时,Google 还推出了强大的智能体生态系统和基础设施升级,包括 Ironwood TPU 和 AI …- 2
- 0
-
IBM放出『PDF灭霸』:2.56亿参数屠榜文档AI
SmolDocling基于 Hugging Face 的 SmolVLM-256M 构建,该模型在参数数量上比同类文档理解任务调整的视觉-语言模型小 5 到 10 倍。视觉骨干采用 SigLIP base patch-16/512(93M)其训练数据经过重新平衡,以强调文档理解(41%)和图像描述(14%)。通过增加像素到标记的比率至每标记 4096 像素,并引入子图像分隔符的特殊标记,提高了标记…- 1
- 0
-
为什么Multi-Agent多智能体系统终将失败?(伯克利论文)
研究背景研究问题这篇文章要解决的问题是多智能体大语言模型(LLM)系统(Multi-Agent LLM systems,简称MAS)在性能上与单智能体框架相比提升甚微的原因。尽管MAS在处理复杂多步骤任务和与不同环境动态交互方面具有潜力,但在流行基准测试中其准确性或性能的提升仍然有限。研究难点该问题的研究难点包括:如何全面分析阻碍MAS有效性的挑战;如何确定导致MAS失败的多种故障模式;如何提出有…- 2
- 0
-
现在评测集太简单了,OpenAI 推出深度搜索评测新基准 BrowseComp
OpenAI 昨日除发布了个人记忆功能外(谜底揭晓!ChatGPT记忆功能全面升级,您的专属ChatGPT上线),还宣布推出并开源 BrowseComp,一项全新且极具挑战性的基准测试。该基准旨在精准衡量智能体在互联网上定位极端难以查找信息的核心能力,以此应对当前评估方法的显著不足。随着 AI 智能体日益依赖网络浏览获取知识,评估其深度挖掘和综合信息的能力变得至关重要。现有基准(如 SimpleQ…- 3
- 0
-
从明天开始,OpenAI将发布大量新产品
今天凌晨2点半,OpenAI联合创始人兼首席执行官Sam Altman发文表示,在接下来的这一周,将发布很多精彩的产品。从明天就开始,(也就是北京时间的周二)。根据OpenAI首席财务官Sarah Friar透露,OpenAI正在研发一款超强的Agent编程产品A-SWE。与传统的开发AI助手不同的是,A-SWE 可以构建应用程序、处理拉取请求、进行质量保证、修复错误和编写文档。应该和当…- 2
- 0
-
智能体互联网不等于多智能体协作:MCP、ANP与A2A的网络效应分析
1 智能体作为网络节点有人把智能体比作互联网上的网站。诚然,未来每个智能体都可注册独一无二的身份并提供可访问性。然而,智能体不再是被动等待访问的信息页面,而是善于主动出击、调用工具、帮助委托人完成意图的行动者。网站间通过超链接静态互联,而智能体间通过行动动态互联。这是Agentic Web与Web的根本不同。这种动态互联会如何发生呢?一种情形是消费者行为的变化会驱动供给侧变革。比如,个人财务助手帮…- 2
- 0
-
看完这10张动图,我终于理解MCP的原理了!它和API不一样!
关于模型上下文协议 (MCP) 的讨论层出不穷,今天我们来了解一下它到底是什么。从直觉上看,MCP像是AI应用的USB-C接口。正如USB-C提供了一种标准化的方式,将设备连接到各种配件,MCP则标准化了AI应用与不同数据源和工具的连接方式。让我们从技术角度稍微深入探讨。MCP的核心是基于客户端-服务器架构,主机应用程序可以连接到多个服务器。它有三个关键组成部分:主机(Host)客户端(Clien…- 5
- 0
-
永别了,GPT-4!
【导读】GPT-4时代,落幕了!它将被GPT-4o完全取代。而下周,我们也极有可能迎来GPT-4.1、o3满血版以及o4-mini这些新模型。大模型进化史,再次迎来关键节点。猝不及防地,GPT-4就这样退出历史舞台了。4月10日,OpenAI正式宣布,即将从ChatGPT中移除两年前推出的GPT-4。从4月30日起,GPT-4将被当前的默认模型GPT-4o完全取代。当然,怀念GPT-4的用户们也不…- 2
- 0
-
GPT-4.1偷偷开跑?神秘模型上线三天已被玩疯,网友发现大量OpenAI痕迹
上线仅三天的神秘模型,已经鲨疯了!大模型聚合平台OpenRouter新推出的Optimus Alpha,已经处理了772亿Token,平均每天超过200亿。并且这个数字还在上升,日Token处理已超过340亿,排名第二,并在Trending榜单上位列第一。有网友试着用它挑战MC-Bench,生成《我的世界》风格的场景,并对比了4o-mini,结果高下立判:还有人系统测试了它的编程水平,发现Opti…- 3
- 0
-
AI浏览代理崛起:OpenAI重磅发布新基准,揭示AI智能搜索挑战
【行客按】当你为了找一个极其冷门的问题答案,在搜索引擎的前十页疯狂翻找,却一无所获时,你是否幻想过:要是有个智能助手能帮我自动搞定该多好?如今,这一幕正在成为现实——这背后的关键技术,就是AI浏览代理(AI Browsing Agent)。近期,OpenAI团队发布了一项极具挑战性的AI浏览代理测试基准——BrowseComp,它的出现像是给AI浏览代理技术开了一场终极“高考”,吸引了全球AI研究…- 3
- 0
-
谷歌 AI Agent-to-Agent 让AI像人类一样交流协作
昨天比较忙,今天下午有点时间、开始写一下。上周的时间,谷歌正式推出了AI Agent-to-Agent(A2A)通信协议,应该说这是很重要的一步。因为AI能像人类一样无缝协作,不是随便一家公司能胜任这项工作的。想象一下,不同公司开发的AI,原本互不相识,现在却能轻松对话、协同完成任务。这对于之前来说是不可思议的事情,电商客服AI能够自动调用物流AI查询订单状态了,完全不需要人工介入或专门开发接口。…- 2
- 0
-
Google Deep Research VS Manus:关公战赵四
Manus官方也没有邮件提醒,反正昨天登录就可以使用了。简单测试对比了一下Google Deep Research with 2.5 Pro的同一主题的研究分析能力。给了一个很简单的任务“API访问Telegram频道内容”Manus的操作很夸张,它是直接起了一台ubuntu虚拟机,然后在sandbox里面完成所有的操作,包含控制浏览器和调用命令行工具。只能说这波太秀了,脑洞大开。然后是内容的获取…- 2
- 0
-
【阿里云百炼推出MCP市场】高德地图MCP + Qwen Max构建AI应用,找公共厕所变得如此轻松
什么是阿里云百炼?阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。它面向开发者和业务人员,让所有人都能参与到大模型应用的设计与构建中。通过其简洁的操作界面,用户轻松完成大模型应用的开发,以及专属模型的训练。百炼支持MCP啦!随着MCP协议的发展,越来越多的云计算平台开始推出MCP托管服务。作为统一大语言模型访问外部资源与工具接口的开源协议,MCP受到开源社区的巨大关注。近期我也发布了…- 1
- 0
-
洞穴之外的星辰:AI时代的认知边疆
AI既是一面照出我们认知局限的镜子,也可能成为锻造新认知维度的熔炉。大语言模型是非物理空间的智能,而物理空间数据通过人类语言实现理解与表达,这种区分物理与非物理智能关系,主要是集中在语言理解与使用中,这也是人类文化创造与积累的前提,正是在这种前提下,我们是整体上被大语言模型困在里面,而多模态的理解,也是语言式的理解路径。从这个绝对意义上看,认知与想象力都不过是语言泛化而已,究竟如何重新评估未来AI…- 2
- 0
-
我也曾一上来就想实现大模型的极限目标,原来那时候真的还没入门!
在AI技术迅猛发展的今天,AI产品的创新不再仅仅取决于技术的先进性,而更在于如何精准匹配市场需求。我们经常看到,一些AI产品在实验室阶段表现惊艳,但真正推向市场后却无人问津。究其原因,核心问题在于:如何为AI产品找到恰当的应用场景,让技术不只是炫技,而是真正创造价值?AI产品的落地并非简单的“技术驱动”,而是模型、技术、场景和商业模式的融合。在AI产品经理的视角下,我们需要系统性地评估模型的能力边…- 3
- 0
-
万字长文深入浅出文本嵌入(Text-Embedding)技术
一、文本嵌入(Text-Embedding) 技术快速入门第一部分是快速入门,第二部分是深入学习文本嵌入技术,请耐心往下读!1. Text-Embedding 技术概述Text-embedding 技术是一种将文本数据转换为向量的技术,通过深度学习模型将文本的语义信息嵌入到高维向量空间中。这些向量不仅能表达文本内容,还能捕捉文本之间的相似性和关系,从而让计算机高效地进行文本检…- 3
- 0
-
MCP配置难?阿里云百炼直接砍掉配置门槛,开箱即用!
这是用firecrawl MCP+Flomo MCP实现灵感的快速捕捉:这是用高德地图MCP实现约会地点的高效挑选:以上对MCP的调用,都是借助阿里云百炼的MCP服务在5分钟内实现的,不用经历Cursor那种繁琐的配置。要更好地理解百炼MCP服务的价值,我们就需要理解MCP为何而来,所以今天这篇文章,我会分为以下三个部分进行展开,分别是:MCP的由来&价值百炼MCP服务解决的问题MCP智能…- 3
- 0
-
我宣布 Grok3 的 API 是最好的大模型接口服务
通过之前的推送《? xAI 超值福利!充 5 美金每月送 150 美金 API 额度!?》已经拿到了 Grok 的 API,最近 Grok3 模型也支持使用 API 调用了。Grok 3 的 API 很多,各自的特性如下:- Grok 3 beta 专业知识+不思考- Grok 3 beta fast 专业知识+更快速+不思考- Grok 3 mini beta 非专业知识+思考- Grok 3 …- 4
- 0
-
详解A2A(Agent2Agent)协议
什么是 A2A 协议A2A(Agent2Agent)协议 是由 Google Cloud 推出的一个开放协议,旨在促进不同 AI 代理之间的互操作性。其主要目标是允许这些代理在动态的、多代理的生态系统中进行有效的通信和协作,无论它们是由不同的供应商构建的还是使用不同的技术框架。A2A 的设计原则总结A2A(Agent2Agent)协议的设计原则旨在提升代理之间的协作能力,确保灵活性、安…- 1
- 0
❯
购物车
优惠劵
搜索
扫码打开当前页
联系我们
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!