法国空姐2电影无删减这位90后北大副阐扬，怎样看待鸿蒙与具身智能？

发布日期：2026-06-16 15:15 点击次数：57

【环球网科技报谈记者张阳】6月13日法国空姐2电影无删减，在华为开发者大会（HDC 2026）现场，中国首档科技洞开麦节目《鸿蒙脑洞掀开麦》开播。北京大学规划机学院副阐扬、上纬启元首席科学家董豪算作星光嘉宾亮相，这亦然他以上纬启元首席科学家身份初度公开亮相。节目现场，董豪高度认同鸿蒙开源共建、技巧平权的理念，强调鸿蒙通过全场景分散式本领冲突开辟壁垒，以开源洞开的姿态凝合民众开发者力量，让高中生、瑕疵东谈主士、国际留学生等都能低本钱革命，真的终了“东谈主东谈主都是开发者”。他以为鸿蒙不仅是操作系统，更是数字时间的普惠基础本领，为AI与具身智能的交融落地提供了重要生态支柱。

算作横跨具身智能领域产学研的众人，董豪不久前北大里面共享中，拆解了刻下效法学习、强化学习、仿真数据集等主流技巧门路的瓶颈，并建议全新横向二维Scaling Law框架，结伴解释寰宇模子、生成式数据增强、东谈主示教数据转念等前沿决策的底层逻辑，为家用、通用东谈主形机器东谈主落地指明技巧演进标的。

如下为共享全文：

具身大模子演进趋势：从效法到强化、从单任务Scaling到通用Scaling我于今仍表现谨记AlphaGo团队作念共享的场景——那时我就在伦敦，UCL离我的住处很近。那场演讲给我留住了极为深切的涟漪，也让我对AI技巧的演进逻辑有了更实质的念念考。

AlphaGo的生效，表现地展现了Al本领跃升的第一套经典范式：先效法，后强化。它最初通过海量东谈主类棋谱进行监督学习，实质上等于效法东谈主类棋手的落子决策。但这种纯效法学习有一个自然的天花板：模子的本领弥远无法突出查验数据中东谈主类的最高水平。

为了突破这个瓶颈，AlphaGo引入了自对弈强化学习：让两个经过预查验的模子相互对弈，通过输赢收尾产生明确的响应信号。在这个过程中，模子不再受限于东谈主类训戒，粗略自主探索出东谈主类从未料到过的战术法国空姐2电影无删减，最终终表现对东谈主类顶尖棋手的突出。

这一“效法-强化”的技巧演进旅途，在其后的ChatGPT身上得到了齐全复刻。ChatGPT最初基于互联网海量文本数据进行大领域预查验，这一阶段的中枢依然是效法学习﹣学习东谈主类语言的抒发形貌和学问体系。而它之是以能从一个“会语言的模子”酿成一个“会好好语言的模子”，99精品久久99久久久久重要在于引入了基于东谈主类响应的强化学习（RLHF）：让模子对吞并个问题生成多个答复，由东谈主类标注员对不同答复的质地进行打分，再将这些东谈主类偏好算作答复信号来微调模子。

与AlphaGo的自对弈比较，ChatGPT的强化学习之是以需要引入东谈主类，中枢永诀在于响应信号的细目性：棋战的输赢由表现的规定决定，是一个完全客不雅的法度；而一个答复的狠恶莫得结伴的规定可循，只可依赖东谈主类的主不雅判断。今天的具身智能大模子，依然在沿着这条被反复考证的技巧旅途前进。现阶段，咱们最初通过蚁集大批东谈主类众人的正确示范数据，让模子进行效法学习，掌抓基本的动作手段和任务经过。但纯效法学习的固有间隙在具身领域相通存在：模子只见过“正确的作念法”，从未资格过“失败的场景”，一朝碰到查验数据中莫得的随机情况，就很容易出错。

而当今责罚这个问题最班师灵验的设施之一，啊哈哈哼啊哈恰是2011年建议的DAgger（数据集团聚）算法。其中枢念念想非常朴素：当模子在真的环境中现实任务出现谬误时，立即由东谈主类众人吸收并进行修正，然后将这些修正后的“纠错数据”回流到查验聚积，对模子进行络续迭代查验。通过这种“试错﹣纠错﹣再查验”的闭环，模子的鲁棒性和泛化本矫健不断得到强化。

值得一提的是，DAgger算法最早被渊博哄骗于自动驾驶领域，但它在自动驾驶场景中碰到了盛大的落地庇荫。一方面，自动驾驶的谬误不时伴跟着严重的安全风险，咱们不成能为了蚁集纠错数据而放任事故发生；另一方面，自动驾驶对单次任务生遵守的条款简直尖刻，哪怕是万分之一的空幻率都可能导致横祸性恶果，长尾问题极其复杂。

比较之下，绝大多数具身智能任务的容错空间要大得多。以叠一稔为例，即使单次生遵守唯有95%，模子完全不错在失败后重新尝试一次，直到生效为止。更清贫的是，这些任务的失败频繁不会产生任何不成扶助的严重恶果。恰是基于这一中枢相反，咱们多情理敬佩：具身智能的营业化落地速率，很可能会比自动驾驶更快。

关联词，当咱们把眼神投向更远的畴昔，就会发现“效法＋强化”的scaling law范式自然能责罚单个任务的落地问题，却无法答复通用具身智能的终极命题。

自动驾驶实质上是在追求单一任务的极致优化——它只需要作念好“安全驾驶”这一件事。但具身智能的终极贪图天渊之别：咱们需要的不是一万个只可作念一件事的专用机器东谈主，而是一个能作念一万件事的通用机器东谈主。

这就意味着，传统Scaling Law的刻画形貌一经走到了非常。以前咱们只把数据量、参数目、规划量算作Scaling的维度，以为只须线性增多这些资源，就能获取线性的本领普及。但在具身智能领域，这套逻辑注定失效：你不成能为寰宇上每一个可能的家务动作、每一种可能的操作场景，都单独蚁集百万级数据、单独查验一个模子。单任务Scaling的旯旮收益会极速递减，最终堕入“一一任务攻克”的死巷子。

因此，咱们必须诞生一个全新的Scaling视角：“任务数目﹣数据量”Scaling Law。咱们要把“任务数目”算作与“数据量”同等清贫的中枢坐标轴。通用本领从来不是在单个任务上堆出来的，而是在海量不同任务之间迁徙出来的。当模子在越来越多不同任务上进行查验时，它会渐渐掌抓物理寰宇的通用王法——比如物体的刚性、重力的作用、摩擦力的影响、用具的通用使用设施。此时，面临一个从未见过的全新任务，模子的开动完成率会权贵普及，达成高生遵守所需的非凡样本量会络续着落，真的终了“越学越快、越学越省”。

今天行业里百花皆放的技巧门路，不论是寰宇模子、UMI，如故仿真数据生成、东谈主类第一视角视频预查验法国空姐2电影无删减，看似标的分散，底层逻辑却高度结伴：所有这些技巧革命，实质上都是为了加快这条新的“任务数目-数据量”Scaling弧线的成型。它们要么在普及单条数据的跨任务迁徙价值，要么在镌汰新增任务的查验本钱，最终共同鼓吹具身智能从“专用”走向“通用”。

法国空姐2电影无删减这位90后北大副阐扬，怎样看待鸿蒙与具身智能？

锋境制造有限公司

热点资讯

推荐资讯

法国空姐2电影无删减 这位90后北大副阐扬，怎样看待鸿蒙与具身智能？

锋境制造有限公司

热点资讯

推荐资讯

法国空姐2电影无删减这位90后北大副阐扬，怎样看待鸿蒙与具身智能？