✈️ Gate 广场【Gate Travel 旅行分享官召集令】
广场家人们注意啦!Gate Travel 已经上线~ 机票+酒店一站式预订,还能用加密货币直接付款 💸
所以说,你的钱包和你的旅行梦终于可以谈恋爱了 😎 💕
现在广场开启 #GateTravel旅行分享官# 活动,邀你来秀旅行灵感 & 使用体验!💡
🌴 参与方式:
1️⃣ 在【广场】带话题 #Gate Travel 旅行分享官# 发帖
2️⃣ 你可以:
你最想用 Gate Travel 去的目的地(私藏小岛 or 网红打卡点都行)
讲讲用 Gate Travel 订票/订酒店的奇妙体验
放放省钱/使用攻略,让大家省到笑出声
或者直接写一篇轻松的 Gate Travel 旅行小故事
📦 奖励安排,走起:
🏆 优秀分享官(1 名):Gate 旅行露营套装
🎖️ 热门分享官(3 名):Gate 旅行速干套装
🎉 幸运参与奖(5 名):Gate 国际米兰旅行小夜灯
*海外用户 旅行露营套装 以 $100 合约体验券,旅行速干套装 以 $50 合约体验券折算,国际米兰旅行小夜灯以 $30合约体验券折算。
📌 优质内容将有机会得到官方账号转发翻牌提升社区曝光!
📌 帖文将综合互动量、内容丰富度和创意评分。禁止小号刷贴,原创分享更容易脱颖而出!
🕒 8月20 18:00 - 8月28日 24:00 UTC+
国产大模型新进展,光芒照进听觉领域
按照传统看法,AI与大模型等涉及到的机器学习概念主要集中在“视觉”领域,经过不懈努力,现在已经拓展到听觉领域了。清华大学与火山语音团队合作,推出认知导向的开源听觉大模型SALMONN,名称源于Speech Audio Language Music Open Neural Network的首字母缩写。Demo链接:
如果仅以人的角度来看,视觉与听觉是既独立又配合的信息系统。但从电脑,大模型等涉及到AI的角度来说,从视觉到听觉的跨越绝非动动嘴或手指那般想象中的简单,其中的意义可以用美国登月先驱阿姆斯特朗的那句名言概括:“这是我个人的一小步,也是人类的一大步。”
而传统的音频处理手段较为繁琐,在接受到音频信号后先要通过API调用底层工具将音频转化为文字信息,再将文字信息输入大模型做后续处理。与之相比,SALMONN可以直接从现实世界获取知识,并在一些复杂场景中也有很好的理解和处理能力。而且由于训练数据全部基于文本指令,因此也可以说它拥有跨模态的交互能力。
从目前的消息来看,SALMONN能够胜任多种多样的语音相关任务,同时又有多种在训练时没有专门学习过的多语言和跨模态能力,如不同语种的语音识别、英语到其他语言的翻译、对语音内容的摘要与提取关键词、通过音频生成故事、音频问答、语音和音频联合推理等任务。
根据官方团队的说法,SALMONN能处理的任务,依据从易到难的程度可以分为三类:1.训练中就学习过的任务,2.训练中没学过,但SALMONN能够基于文本输入完成的任务,3.训练中没学过,需要直接感知音频或视频的多模态大模型才能完成的任务。
**之所以会有如此窘境,主要是因为机器听觉与机器视觉的先天性差异,以及由此导致的一系列困难。**过去曾介绍过,苹果的Siri已经算是质量很好的语音助手了,但依然经常被人嘲讽为“人工智障”。后来又有消息说苹果对Siri也有诸多不满,历次发布会里对它一直都很少提及,即使提到可能也只是“更智能”“更强大”之类的套话。之前马克·古尔曼爆料苹果在秘密开发Apple GPT时也说过,Siri部门长期陷于费力不讨好的泥沼中,苹果多年来一直想为Siri进行一次革命性更新,甚至是为此而单独规划生产线,专门出一款新产品,将Apple GPT与Siri集成到一起或许是一种好方法,能识别语音且能用语音控制的大模型,的确是比较酷的。