奥运星-日韩国产一区二区三区-汽车性能网评-日韩国产一区二区-提供个性化汽车资讯

首頁 > 汽車活動 > 汽車活動 > 谷歌對壘OpenAI,誰更勝一籌?

谷歌對壘OpenAI,誰更勝一籌?

發布時間:2024-05-17 23:13:19

中國戰略新興產業融媒體記者 艾麗格瑪

當地時間5月14日,谷歌在2024 Google I/O大會上展示了其在AI技術上的一系列突破。就在一天前,OpenAI發布的GPT-4o已經引發了一波熱議,而發布時間僅差一天的兩個技術產品被視為是這兩家科技企業在AI領域真刀明槍的激烈對壘。

谷歌和OpenAI的發布會,不約而同地強調了AI與現實世界的真正交互——例如用攝像頭感知環境、識別內容和互動。不過,在產品功能重點方面,兩家公司各有千秋。

那么,最新的AI大模型到底能做到什么程度?它們能帶來生產力的質變,還是僅僅停留在概念性的炒作?

01

各有側重的階段性更新

當地時間5月13日,OpenAI通過直播展示了產品更新。

這次,OpenAI并未推出搜索引擎,也未推出GPT-4.5或GPT-5,而是發布了GPT-4系列新模型GPT-4o以及AI聊天機器人ChatGPT的桌面版本。這可以看作是對GPT-4的一次階段性更新,而根據OpenAI官方網站介紹,GPT-4o中的“o”代表Omni,也就是“全能”的意思。

據介紹,GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為GPT-4 Turbo的一半,視頻、音頻功能得到改善。OpenAI公司CEO山姆·奧爾特曼在博客中表示,ChatGPT免費用戶也能用上新發布的GPT-4o。此外,OpenAI還與蘋果走到一起,推出了適用于macOS的桌面級應用。

OpenAI技術負責人Mira Murati在直播中表示:“這是我們第一次在易用性方面真正邁出的一大步。”

OpenAI將GPT-4o定位為GPT-4性能級別的模型。據介紹,GPT-4o在傳統基準測試中,文本、推理、編碼能力達到GPT-4 Turbo的水平。該模型接收文本、音頻和圖像輸入時,平均320毫秒響應音頻輸入,與人類對話中的響應時間相似,英文文本和代碼能力與GPT-4 Turbo相當,在非英文文本上有改善,提高了ChatGPT針對50種不同語言的質量和速度,并通過OpenAI的API提供給開發人員,使其即時就可以開始使用新模型構建應用程序。

與之形成對比的是,谷歌終于將自己在搜索領域的強項融入了AI產品:比如“Ask with video”,利用Gemini的多模態能力與Google Lens相結合,可以實現視頻搜索——錄制一段視頻,就能知道用戶使用唱片機,甚至維修照相機;Google Photos中還推出了新的AI功能“Ask Photos”,可以通過簡單的提問在大量照片中找出“孩子多年來學習游泳的歷程”。

谷歌版 AI 搜索的輸出結果不再是網址的羅列,而是一個全新的整合頁面——它更像一份針對用戶提問而形成的報告,不僅包括對問題本身的回答,也包括對用戶可能忽略問題的猜測和補充。

在大會上,谷歌搜索部門負責人Liz Reid表示,“生成式AI搜索將為你做的比你想象更多。不管你腦子里在想什么,或者你需要做什么,只要問,谷歌就會為你搜索。”她解釋說,AI概述在收到一個一般查詢后會提供一系列潛在答案,并鏈接到更深入的內容。它還能通過在搜索中使用“多重推理”在幾秒鐘內回答更復雜的問題和子問題。

谷歌同樣展示了現實交互功能,其一款名為Project Astra的多模式AI助手,可以觀看并理解通過設備攝像頭看到的內容,記住用戶的東西在哪里,幫用戶在現實世界搜索物品,或是完成其他任務。

但是,相比于OpenAI簡單直接的視頻說明,谷歌在現場演示的AI工具卻遭遇“翻車”。

開場時,一位從舞臺上的茶杯中鉆出的DJ,在臺上使用谷歌內部開發的一款AI DJ小工具 MusicFX DJ,在舞臺上現場用隨機生成的關鍵詞,來創造出一首曲目——很可惜,創造出的曲調有點糟糕。

不過,相比于2023年在演示Gemini后的“群嘲”,今年谷歌DeepMind推出的Project Astra使用視頻顯得更加可信:操作者以智能手機為媒介,讓大模型實時收集環境中的各種信息,并在圍繞著辦公室轉了一圈后突然提問:“你記得眼鏡在哪里嗎?”AI從環境信息中捕捉到了眼鏡的位置,并給出了正確的方位提示。

02

多模態成為重點

在直播中,OpenAI演示了一段員工與GPT-4o對話的視頻,模型反應速度與人類相近,GPT-4o可利用手機攝像頭描述其“看到”的東西。另一段展示視頻里,GPT-4o被裝在兩個手機上,其中一個代表人類與電信公司打電話溝通設備更換事項,另一個GPT-4o扮演電信公司客服人員。OpenAI還展示了GPT-4o搭載在手機上的實時翻譯能力。

GPT-4o的發布,標志著OpenAI在多模態AI領域的重大突破。這款新模型不僅能夠實時對音頻、視覺和文本進行推理,還能夠生成文本、音頻和圖像的任意組合輸出,大大提升了與人類的交互體驗。GPT-4o的響應速度極快,音頻輸入的平均響應時間僅為320毫秒,與人類對話中的自然反應時間相當。此外,GPT-4o在多語言處理、視覺和音頻理解方面的能力也有顯著提升,創下了多項新的行業紀錄。

根據OpenAI介紹,GPT-4o與GPT-3.5、GPT-4的語音對談機制不同。GPT-3.5和GPT-4會先將音頻轉換為文本,再接收文本生成文本,最后將文本轉換為音頻,經歷這三個過程,音頻中的情感表達等信息會被折損,而GPT-4o是跨文本、視覺和音頻的端到端模型,是OpenAI第一個綜合了這些維度的模型,可更好進行對談。

而如前所述,谷歌本次發布的AI Overview,也在多模態的問題上做足了文章。

那么,“多模態”到底是什么?

多模式深度學習,是一個機器學習的子領域,旨在訓練人工智能模型來處理和發現不同類型數據——也就是模式之間的關系,通常是圖像、視頻、音頻和文本。通過結合不同的模態,深度學習模型可以更普遍地理解其環境,因為某些線索僅存在于某些模態中。

例如一個能夠識別人類面部情緒的任務,它不僅需要AI看一張人臉(視覺模態),還需要關注人聲音(音頻模態)的音調和音高,這些內容編碼了大量關于他們情緒狀態的信息,這些信息可能無法通過他們的面部表情看到,即使他們經常是同步的。

在多模態深度學習中,最典型的模態是視覺(圖像、視頻)、文本和聽覺(語音、聲音、音樂)。其他不太典型的模式包括3D視覺數據、深度傳感器數據和LiDAR 數據,這是在自動駕駛汽車中經常用到的典型數據。

此外,在臨床實踐中,成像方式包括計算機斷層掃描(CT)掃描和X射線圖像,而非圖像方式包括腦電圖(EEG)數據。傳感器數據,如熱數據或來自眼動追蹤設備的數據也可以包含在列表中。

多模態神經網絡通常是多個單模態神經網絡的組合。例如,視聽模型可能由兩個單峰網絡組成,一個用于視覺數據,一個用于音頻數據。這些單峰神經網絡通常分別處理它們的輸入。這個過程稱為編碼。在進行單峰編碼之后,必須將從每個模型中提取的信息融合在一起。已經提出了多種融合技術,范圍從簡單的連接到注意機制。多模態數據融合過程是最重要的成功因素之一。融合發生后,最終的“決策”網絡接受融合后的編碼信息,并接受最終任務的訓練。

可以看出,要想讓停留在“畫畫寫字唱歌”程度的AI們真正與現實世界產生交互并影響生產過程,多模態研發是必經之路。

汽車活動更多>>

2024年西北工業大學附屬中學教師崗位招聘公告 2025年度天津市衛生健康委員會所屬天津市和平保育院(天津市衛生健康委員會幼兒園)招聘方案(3人) 2024年安順市紫云自治縣到重點師范大學等高校招聘師范生公告 2025年泉州市惠安縣公辦學校赴西南大學專項招聘編制內新任教師公告 還在看漢蘭達和攬巡?不到22萬,這款車型直接卷翻合資車! 動力總成終身質保只要15.99萬元起,帕薩特380TSI家族越級上市 虧電油耗僅3.8L/100km,2025款漢DM-i又是爆款? 9月10日,問界M9大五座即將上市,是乘勝追擊還是穩中求變?讓我們通過這款車來看看50萬以上豪華車車主真正需要什么科技豪華?事實上,問界M9的熱銷一定有其原因,除了產品力在各個維度與BBA保持相同水準或超越,更是把50萬以上豪華車車主的使用場景研究得分毫不差。 全新一代架構與平臺齊發,東風汽車科技躍遷再提速 12萬不到就能買純電中大型車,星海S7到底有多猛? 捷途山海L7上市:不是純越野,想做“多面手SUV”? 銀河“收編”幾何,星愿重構10萬A0級電車新秩序 2024年江西省皮膚病專科醫院招聘勞務派遣制人員公告 2024年撫州市第一人民醫院招聘博士簡章 2024年贛州市應急管理局招聘工作人員公告 2024年贛州市“引才聚贛州 攜手創未來”事業單位招聘高層次人才公告(西安站) 2024年吉安幼兒師范高等專科學校招聘教師公告 2024年贛州市招聘綜合行政執法隊工作人員公告 2024年贛州市會昌縣人民法院招聘聘用制工作人員公告 2024年萍鄉市第二人民醫院招聘合同制放療物理師公告 軸距2947mm,爆237馬力,惠后20.97萬元起,這臺豪華中型車帶勁不 售價11.98萬,軸距2820mm,配側滑門+L2級輔助駕駛,這款SUV香? 后驅+掀背,綜合續航1330km,長安啟源A07全新真香版適合家用 鴻蒙智行TechDay:華為ICT技術的積累 要怎樣引領智能駕駛新時代? 業界大佬齊聚極越07上市現場 李彥宏笑出表情包 嘴角比AK都難壓 動力/座艙/智駕全面升級 新款福特探險者上市 起售價309800 2025款奇瑞瑞虎9油電雙車上市 售價15.29萬元起 問界新M7交付量突破20萬臺 推出國慶購車權益 朋友8.5萬買卡羅拉,總覺得哪里不對,你們說呢? 五菱驚世K-Car!側滑門神車僅6萬?國產車王再戰江湖?
主站蜘蛛池模板: 实验室pH计|电导率仪|溶解氧测定仪|离子浓度计|多参数水质分析仪|pH电极-上海般特仪器有限公司 | 湖南印刷厂|长沙印刷公司|画册印刷|挂历印刷|台历印刷|杂志印刷-乐成印刷 | 【铜排折弯机,钢丝折弯成型机,汽车发泡钢丝折弯机,线材折弯机厂家,线材成型机,铁线折弯机】贝朗折弯机厂家_东莞市贝朗自动化设备有限公司 | 北京租车牌|京牌指标租赁|小客车指标出租 | 铝箔袋,铝箔袋厂家,东莞铝箔袋,防静电铝箔袋,防静电屏蔽袋,防静电真空袋,真空袋-东莞铭晋让您的产品与众不同 | 云阳人才网_云阳招聘网_云阳人才市场_云阳人事人才网_云阳人家招聘网_云阳最新招聘信息 | 沈阳楼承板_彩钢板_压型钢板厂家-辽宁中盛绿建钢品股份有限公司 轴承振动测量仪电箱-轴承测振动仪器-测试仪厂家-杭州居易电气 | 水厂自动化-水厂控制系统-泵站自动化|控制系统-闸门自动化控制-济南华通中控科技有限公司 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 排烟防火阀-消防排烟风机-正压送风口-厂家-价格-哪家好-德州鑫港旺通风设备有限公司 | 悬浮拼装地板_幼儿园_篮球场_悬浮拼接地板-山东悬浮拼装地板厂家 | 石家庄网站建设|石家庄网站制作|石家庄小程序开发|石家庄微信开发|网站建设公司|网站制作公司|微信小程序开发|手机APP开发|软件开发 | 河南中整光饰机械有限公司-抛光机,去毛刺抛光机,精密镜面抛光机,全自动抛光机械设备 | 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 螺旋丝杆升降机-SWL蜗轮-滚珠丝杆升降机厂家-山东明泰传动机械有限公司 | 辐射色度计-字符亮度测试-反射式膜厚仪-苏州瑞格谱光电科技有限公司 | 万濠影像仪(万濠投影仪)百科-苏州林泽仪器 | 智慧钢琴-电钢琴-便携钢琴-数码钢琴-深圳市特伦斯乐器有限公司 | 蓝莓施肥机,智能施肥机,自动施肥机,水肥一体化项目,水肥一体机厂家,小型施肥机,圣大节水,滴灌施工方案,山东圣大节水科技有限公司官网17864474793 | 奶茶加盟,奶茶加盟店连锁品牌-甜啦啦官网 | OLChemim试剂-ABsciex耗材-广州市自力色谱科仪有限公司 | 合肥升降机-合肥升降货梯-安徽升降平台「厂家直销」-安徽鼎升自动化科技有限公司 | 丽陂特官网_手机信号屏蔽器_Wifi信号干扰器厂家_学校考场工厂会议室屏蔽仪 | 滚筒烘干机_转筒烘干机_滚筒干燥机_转筒干燥机_回转烘干机_回转干燥机-设备生产厂家 | 双效节能浓缩器-热回流提取浓缩机组-温州市利宏机械 | 温州食堂承包 - 温州市尚膳餐饮管理有限公司 | 光照全温振荡器(智能型)-恒隆仪器 | 首页|光催化反应器_平行反应仪_光化学反应仪-北京普林塞斯科技有限公司 | 悬浮拼装地板_幼儿园_篮球场_悬浮拼接地板-山东悬浮拼装地板厂家 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | 选矿设备,选矿生产线,选矿工艺,选矿技术-昆明昆重矿山机械 | 托利多电子平台秤-高精度接线盒-托利多高精度电子秤|百科 | 挖掘机挖斗和铲斗生产厂家选择徐州崛起机械制造有限公司 | 定硫仪,量热仪,工业分析仪,马弗炉,煤炭化验设备厂家,煤质化验仪器,焦炭化验设备鹤壁大德煤质工业分析仪,氟氯测定仪 | 高低温万能试验机-复合材料万能试验机-馥勒仪器 | 大型多片锯,圆木多片锯,方木多片锯,板材多片锯-祥富机械有限公司 | 领袖户外_深度旅游、摄影旅游、小团慢旅行、驴友网 | 华禹护栏|锌钢护栏_阳台护栏_护栏厂家-华禹专注阳台护栏、楼梯栏杆、百叶窗、空调架、基坑护栏、道路护栏等锌钢护栏产品的生产销售。 | 电加热导热油炉-空气加热器-导热油加热器-翅片电加热管-科安达机械 |