hth华体会网页登录:
Veryken前沿行业动态|AI·半导体·电子消费品|动力电池|储能|新能源汽车|光伏
DeepSeek近日悄然发布其V3模型的最新更新版本V3-0324。这次更新虽然被官方轻描淡写地称为“小版本升级”,但从用户的实测和社区反馈来看,其技术突破和应用场景的拓展堪称一次“编程革命”。
新版V3-0324在编程能力上的提升尤为显著,已达到与Claude 3.7 Sonnet相当的水平。用户仅需一个提示词,就能让V3生成完整的前端页面,包括HTML、CSS和JavaScript代码。这种能力不仅大幅度的提高了开发效率,还降低了技术门槛,使中小企业和个人开发者能快速构建复杂的前端应用。
在实际测试中,V3-0324生成的代码质量和设计美感均优于上一代模型,甚至在某些场景中超过了Claude 3.7 Sonnet的表现。这种能力对于创业者来说是一个巨大的福音,尤其是在需要快速迭代和原型开发的初创阶段。
新版V3-0324采用了MIT开源许可,这一变化对商业开发者和企业来说意义重大。MIT许可允许模型与商业和专有软件自由集成,逐步降低了AI技术的使用门槛。对于创业者而言,这在某种程度上预示着他们能够更灵活地将高性能AI模型嵌入到自己的产品中,加速产品上市时间。
DeepSeek V3-0324采用了6710亿参数的专家混合模型(MoE),并通过创新的“偏差项”机制和节点受限的路由机制,解决了传统MoE模型中的负载不均衡问题。这些技术创新不仅提升了模型的推理速度,还使其在大规模分布式训练中表现出更高的效率。
社区对新版V3的反馈普遍积极,用户觉得其编程能力已达到目前最强开源模型的水平。DeepSeek的开源策略和持续迭代能力形成自己独一无二的技术路线和社区影响力,正在对闭源商业模型构成强有力的挑战。(极客公园,机器之心,量子位,华尔街见闻)
OpenAI近期推出的GPT-4o图像生成功能引发行业的广泛关注。该功能不仅在图像生成的质量和多样性上实现重大突破,还因其简单易用的操作方式迅速赢得了用户的青睐。
GPT-4o的图像生成功能涵盖了从高保真照片到风格化插图的广泛场景。用户都能够轻松生成各种风格的图像,包括宫崎骏风格的动画、梵高风格的绘画,以及复杂的3D深度图。这些图像不仅细节丰富,而且风格一致性极强,几乎无需多轮修改即可达到满意效果。
GPT-4o的图像生成功能上线后迅速火爆,甚至导致OpenAI的GPU资源紧张,不得不实施限流措施。这一现象表明,市场对高质量AI绘图工具的需求极为旺盛。与此同时,GPT-4o的强大功能也对Midjourney等竞争对手构成了直接威胁,Midjourney CEO甚至公开表达了对GPT-4o的不满。
尽管GPT-4o的图像生成功能备受好评,但也引发了版权争议。特别是其生成吉卜力风格图像的能力,引起了吉卜力工作室的不满,甚至发出了律师函。这表明AI生成图像的版权问题仍需进一步明确。
GPT-4o的成功表明,AI绘图工具的市场需求巨大,且技术门槛正在降低。未来随技术的慢慢的提升和版权问题的逐步解决,AI绘图工具有望在更多领域得到普遍应用。(机器之心,量子位)
阿里巴巴近期推出升级版新夸克,将其定位为“AI超级框”,试图在C端市场抢占AI应用的超级入口。这款被寄予厚望的产品,不仅承载着阿里在AI to C领域的战略野心,也面临着商业化和市场之间的竞争的双重挑战。
新夸克的核心亮点在于其“AI超级框”,用户只需输入指令,AI中枢会自动识别意图并调用合适的工具达成目标。无论是搜索、写作、学术研究还是复杂方案设计,新夸克都能通过深度搜索和多工具调用提供一站式解决方案。
例如,用户都能够要求生成详细的旅游攻略,或通过上传图片获取详细的解析。这种能力使新夸克在教育、办公和日常生活中具有广泛的应用场景。
尽管新夸克在技术和用户体验上取得显著进步,但其商业化路径仍不清晰。阿里试图通过网盘会员订阅和AI增值服务变现,但目前AI功能更多是附加服务,未能成为用户付费的核心动力。此外新夸克还面临着来自百度、腾讯等巨头的激烈竞争。百度通过文心大模型深耕教育和医疗场景,腾讯的元宝则借助DeepSeek大模型吸引用户。新夸克需要在教育、办公等垂直场景中巩固优势,以应对竞品的挑战。
阿里计划未来三年投入3800亿元用于云计算和AI基础设施建设,显示出其在AI领域的决心。新夸克作为阿里AI to C的核心产品,承载着连接消费端与云服务的使命。通过整合天猫精灵、通义大模型等资源,阿里试图构建“软件+硬件+模型”的闭环生态。
新夸克的成功与否将取决于两场赛跑:一是与时间的赛跑,能否在阿里资源倾斜的窗口期内证明其商业价值;二是与竞品的赛跑,能否巩固其在教育、办公等场景的优势。对于创业者和投资者而言,新夸克的技术路线和市场策略值得密切关注,它可能成为AI时代C端市场的关键玩家。(钛媒体,量子位)
谷歌近日推出其最强大的推理模型Gemini 2.5 Pro,谷歌CEO称其为“有史以来最智能的AI模型”。这款模型在多个基准测试中表现出色,尤其是在推理、数学、科学和编程能力方面,展现了强大的技术实力。
Gemini 2.5 Pro的编程能力相比上一代实现了质的飞跃。它能快速生成复杂代码,例如贪吃蛇游戏,并在添加障碍物和特殊道具后依然表现稳定。这种能力对于开发者来说助力不小,尤其是在需要快速迭代和原型开发的场景中。
Gemini 2.5 Pro延续了Gemini系列的多模态能力,支持文本、音频、图像、视频及代码库输入。其100万token的上下文窗口(即将提升至200万)使其在处理复杂任务时更加得心应手。无论是图像处理还是代码生成,Gemini 2.5 Pro都能胜任。
在对话能力方面,Gemini 2.5 Pro在Chatbot Arena榜单上强势登顶,创下前所未有的最大分数飞跃,比Grok-3和GPT-4.5高近40分。它在复杂指令、编程、数学、创意写作和指令跟随等方面全面领先,堪称“六边形战士”。
谷歌并未公开Gemini 2.5 Pro的技术细节,但从其博客中可以推测,技术突破主要集中在强化学习、思维链提示和后训练。这种技术路线为AI模型的推理和多模态能力提供了新的发展方向。Gemini 2.5 Pro的推出意味着AI技术正在快速演进,推理和多模态能力将成为未来的重要竞争点。(机器之心)
阿里通义千问团队近期开源了两款重磅多模态AI模型Qwen2.5-VL-32B和Qwen2.5-Omni,进一步巩固其在AI领域的技术领先地位。
Qwen2.5-VL-32B模型在视觉推理和多模态任务中表现出色。相比此前的72B模型,32B版本在数学推理、图像细粒度理解和回复的主观偏好方面均有显著提升。特别是在MMMU、MMMU-Pro和MathVista等基准测试中,32B模型展现了更强的准确性和细粒度分析能力。
该模型解决了“72B模型过大”和“7B模型不够强大”的问题,成为多模态AI Agent部署实践中的最佳选择。用户可以通过Qwen Chat直接体验这一模型,感受其在图像解析和内容识别任务中的强大能力。
Qwen2.5-Omni是阿里推出的全新旗舰级多模态大模型,支持文本、图像、音频和视频的全面感知,并能实时生成流式文本和自然语音响应。这一模型采用了创新的Thinker-Talker架构,支持实时语音和视频聊天,为用户提供了无缝的交互体验。
Qwen2.5-Omni不仅在多模态任务中表现优异,还在单模态任务中展现了强大的性能。例如在语音识别、翻译、音频理解和图像推理等任务中,均达到最先进的水平。
阿里通过开源Qwen2.5系列模型,不仅展示了其在多模态AI领域的技术实力,也为开发者和企业提供了强大的工具支持。对创业者来说,这些模型的开源意味着更低的开发成本和更高的技术普惠性,尤其是在需要处理复杂多模态数据的场景中。
对投资者而言,阿里在多模态AI领域的持续投入和技术突破,表明这一领域具有巨大的市场潜力。随着多模态AI技术的不断成熟,其应用场景将从智能助手扩展到教育、医疗、金融等多个行业,为相关企业带来新的增长机遇。(机器之心)
在不久前举行的GTC大会上,英伟达CEO黄仁勋携一系列重磅产品和技术发布震撼登场,为AI行业注入了新的活力。
英伟达推出全新的Blackwell Ultra架构AI芯片GB300,其推理性能比上一代GB200提升了1.5倍,配备20TB HBM3内存,是前代的1.5倍。这款芯片专为AI推理任务设计,支持从预训练到推理的全场景应用。黄仁勋坦陈AI行业正从“模型越大越好”向“推理成本最低、效率最高”转变,推理效率将成为未来AI竞争的关键。
这意味着基于英伟达芯片的AI推理解决方案将更具市场竞争力,创业与投资者需重点关注那些能有效利用高性能推理芯片优化业务流程的企业,尤其是在自然语言处理、图像识别等需要大量推理计算的领域。
第一款DGX Spark就是英伟达在今年1月CES中发布的那个全球最小的个人AI超级计算机Project Digits。第二款DGX Station采用GB300,也是首个采用这款芯片的AI电脑。这两款个人AI超级计算机是面向研究人员、数据科学家、AI开发者和学生设计的。
英伟达推出号称“AI工厂的操作系统”的Dynamo分布式推理服务库,通过动态调度GPU资源、智能路由和内存管理大幅提升了推理效率。按照英伟达的说法,使用Dynamo优化推理,能让Blackwell上的DeepSeek-R1的吞吐量提升36倍,实现了DeepSeek-R1推理性能世界纪录。Dynamo开源后,开发者可以免费获取并部署在多达1000个GPU上,这为中小企业降低了AI应用的门槛。
开源意味着更低的开发成本和更快的迭代速度,创业与投资者可关注那些能基于Dynamo系统构建独特AI应用场景的初创公司,尤其是在医疗、金融、教育等垂直领域。
英伟达发布了全球首个开源人形机器人基础模型Isaac GR00T N1,采用“快思考+慢思考”的双系统架构,支持复杂任务的自主规划与执行。与Google DeepMind和Disney合作开发的开源物理引擎Newton,为机器人模拟训练提供了强大的技术支持。
创业者可以利用这些开源工具快速切入机器人赛道,尤其是在工业自动化、物流配送等刚需场景。投资者需留意那些能结合开源模型和行业痛点,提供完整解决方案的团队。
英伟达首次公开硅光子技术(CPO)在AI计算中的应用,推出Spectrum-X和Quantum-X网络交换机,将端口数据传输速度提升至1.6Tb/s,总传输速度达400Tb/s。此外,2026年推出的Rubin芯片和2027年的Rubin Ultra,性能将分别达到GB300的3.3倍和14倍,后续以费曼命名的新架构也已规划。
这表明英伟达正在构建从经典计算到量子计算的完整算力生态。创业与投资者可关注光芯片和量子计算相关的上下游产业,提前布局有望在下一代算力革命中占据先机的企业。
尽管英伟达股价在GTC后出现短期波动,但黄仁勋提出的“推理阶段Scaling Law才刚开始”的论断值得深思。随着AI从虚拟世界向物理世界的渗透,算力需求将呈现指数级增长。短期内投资者可关注Blackwell Ultra的市场接受度,中长期则需聚焦英伟达在物理AI和量子计算领域的战略落地。(爱范儿,极客公园,机器之心,量子位,钛媒体,财联社)
百度近日发布了两款重磅大模型文心X1和文心4.5并全面免费开放,它们不仅在技术上实现了重大突破,还以极低的API价格为开发者和企业提供了极具吸引力的选择。
文心X1是一款深度思考模型,具备强大的理解、规划、反思和进化能力。它支持多模态输入,并能灵活调用多种工具,如高级搜索、图片理解、AI绘图和代码解释器。在逻辑推理和复杂任务处理方面表现出色,例如生成详细的旅游攻略或解析复杂图片内容。
文心4.5则是百度的新一代原生多模态基础大模型,擅长处理图片、音频和视频等多模态数据。它能识别梗图背后的幽默含义,分析视频内容,并支持语音交互。这种能力使其在内容创作、教育和娱乐等领域具有广泛应用。
百度通过飞桨和文心的联合优化大幅降低了推理成本。文心X1的API价格低至0.002元/千tokens,文心4.5的API价格低至0.004元/千tokens,远低于GPT-4.5和DeepSeek等竞争对手。这种价格优势使中小企业和个人开发者能以极低的成本接入高性能AI模型。
百度的免费开放策略和极低的API价格,正在加速AI技术的普及和应用。文心X1和4.5的推出,不仅展示了百度在AI技术上的创新能力,也为行业提供了一种更经济高效的解决方案。百度计划在6月30日正式开源文心大模型,并将在下半年发布文心5.0,进一步巩固其在AI领域的领先地位。
对创业者和投资者来说,百度的技术路线和市场策略意味着更低的进入门槛和更高的技术普惠性。文心X1和4.5的多模态能力和工具调用能力,为开发复杂应用提供强大的技术支持,值得密切关注。(机器之心,量子位)
智谱AI近日发布了一款具有里程碑意义的产品AutoGLM沉思,它不仅是国内首个免费开放的智能Agent,还具备边思考边行动的能力。
AutoGLM沉思的核心亮点在于其“沉思能力”,执行任务时能像人类一样进行深度思考和规划。用户只需输入一个需求,AutoGLM沉思会自动打开浏览器,通过搜索、筛选、分析信息,最终生成一份经过充分查证的报告。这种能力使它在信息检索、汇总和分析型任务中表现尤为出色。
例如,用户能要求它设计一份旅行攻略,它会通过搜索小红书、知乎等平台的真实用户评论,生成一份详细的旅游计划。在另一个案例中,AutoGLM沉思甚至帮助用户在短短14天内孵化出一个拥有5000多个粉丝的小红书账号并接到了商单。
AutoGLM沉思的技术栈包括GLM-4-Air-0414基座模型和GLM-Z1-Air推理模型。GLM-Z1-Air推理模型的性能比肩DeepSeek-R1,但推理速度提升了8倍,成本仅为后者的1/30。这种高效、低成本的推理能力为中小企业和个人开发者提供了极大的便利。
智谱计划在4月14日正式开源AutoGLM沉思背后的所有模型,包括基座模型、推理模型和沉思模型。这一开源策略将进一步降低开发门槛,推动AI Agent技术的普及和应用。
对于创业者来说,AutoGLM沉思提供了一个强大的工具,能显著提升信息处理和任务执行的效率。无论是内容创作、市场调研还是客户服务,AutoGLM沉思都能成为创业团队的得力助手。对于投资者而言,智谱在AI Agent领域的技术领先性和开源策略,使其成为值得关注的标的。随着AI从生成式向Agent式演进,具备自主推理和行动能力的智能体将成为未来的重要趋势。智谱的技术布局和市场策略,有望在这一领域占据先机。(爱范儿,机器之心)
马斯克近日宣布其人工智能公司xAI通过全股票交易收购X平台(原推特)。此次收购对xAI的估值为800亿美元,对X的估值为330亿美元,合并后的公司估值超过1000亿美元。
马斯克的xAI自2023年成立以来迅速在AI领域崭露头角,推出多个与OpenAI竞争的AI模型和产品。X作为全球最大的社交网络之一,拥有海量的用户数据和广泛的影响力。此次收购旨在整合xAI的AI技术和X的用户资源,以加速AI技术的应用和普及。
通过此次收购,xAI将获得X平台的海量数据,这些数据对于训练AI模型至关重要。同时X也将借助xAI的AI技术提升使用者真实的体验和平台功能。xAI的聊天机器人Grok已与X深度整合,为用户提供更智能的互动体验。
这次收购不仅巩固了马斯克在AI领域的地位,也为其他科技公司提供了整合AI与社交媒体的范例。OpenAI和Anthropic等竞争对手可能会采取类似的战略,以增强其用户覆盖和分发能力。
Wedbush分析师认为,这次收购可能是马斯克整合旗下业务的第一步,未来可能会看到更多类似的整合。对创业者和投资者来说,这次收购表明AI与社交媒体的结合将成为未来的重要趋势。(机器之心,华尔街见闻)
蚂蚁集团近期宣布,其自研的百灵系列大模型(Ling-Lite和Ling-Plus)在训练阶段通过使用国产AI芯片和优化技术,成功将训练成本降低了约20%。
蚂蚁的Ling团队通过构建约9万亿token的高质量语料库并采用创新的混合专家(MoE)架构,显著提升了训练效率。在预训练阶段,蚂蚁使用低规格硬件系统,并通过优化模型架构和训练策略(如XPUTimer和EDiT策略),将训练成本从每1万亿token约635万元人民币降至508万元,节省了近20%的成本。
这表明即使在性能较弱的硬件上,也能训练出先进的大规模MoE模型。这为资源受限的中小企业提供了更灵活的AI开发选择,同时也为中国AI技术的自给自足提供了重要支持。(钛媒体)
扯但,这东西没法用,Tear,你给他说一个任务,任务处理一半就丢那了,而且,偏好段回答,没准你的提示词就被他的回答长
当地时间5月16日,美国财政部公布的数据显示,2025年3月,美债前三大海外债主中,日本、英国增持美国国债,中国减持。中国由美国第二大债主变为第三大债主,英国变为第二大债主。随着美国总统特朗普对全球推出百年未见的高关税后,美国债市陷入动荡。
近日,美国加州里士满市发生多起鸟类离奇死亡事件,引发当地民众困惑与好奇。自今年2月以来,该市陆续清理出50多只鸟类尸体,甚至曾单日死亡5只以上。众多鸟类在飞行途中突然“爆炸”,尸体坠落在街道或民宅后院。目击者称,鸟类坠落前听到巨大爆炸声,靠近地面时瞬间爆炸,场景十分残忍。
交通局一职工先后与两名女生办婚礼?男子被曝月入三千,女友均谈数年!当地交通局回应
近日,有网友爆料,浙江丽水松阳县一交通局职工在5月份先后和两名女生举办婚礼。有人称,男子月入三千谈两个女朋友:一个7年,一个3年,这个月办婚宴暴露了。网传爆料据网传图片显示,该男生已先后与两名女生拍摄过婚纱照,并都制作了结婚请帖。
当地时间5月12日,中美经贸高层会谈后,双方发布《中美日内瓦经贸会谈联合声明》,大幅降低双边关税水平,基本取消了4月2日美国发动关税战以来加征的关税。彭博社指出,美国在会谈中作出了让步,中国几乎得到了所希望的最理想结果。这令一直重视相关进展的岛内舆论炸了锅。
丈夫因病去世前留下自书遗嘱,名下房产存款等财产均由妻子继承,法院:不符合“遗嘱必留份”制度
丈夫王某在病逝前立自书遗嘱,将名下房产、存款全归妻子路某继承。两人共育两女,大女20岁、小女5岁路某,持遗嘱办理过户受阻后诉至法院。
巴西总统卢拉日前在接受总台记者正常采访时表示,希望逐步加强巴西与中国的关系,深化两国在各领域合作,共同捍卫多边主义和自由贸易。
知情人回应娃哈哈为何找今麦郎代工 市场需求突增 内部产能不足 代工不到一年,今年4月已终止合作
福建8岁男童邹煜樽山顶走失,我们肯定要活要见人死要见尸,我就不信会凭空消失 #福建8岁男童在山顶失踪 #邹煜樽#当地辟谣男童失联山上现人体组织 #石谷解
从不确定中寻找确定性,探寻未来投资方向。聚焦AI、芯片、光伏、动力电池、储能等赛道,以全面立体的高价值信息打破行业认知壁垒,提升投资决策能力