今天在嘉定藏书楼待了一下昼,啃了个100页的论说,莫得晦气,全是享受。这篇关于原土生成式AI的想考比较到位,莫得太多假大空,回想几个要点:
▪️阛阓限度:2023-2025 年工夫,BBAT 将为生成式AI插足 90 亿好意思元的GPU成本支拨(75 万个A800 的 GPU)一之濑亚美莉,占该工夫BBAT总成本支拨的 25%
▪️行业层面:GPU地缘zz风险很高。阛阓对原土公司使用国际云平台历练AI模子存在担忧一之濑亚美莉,计较才能是原土的相对瓶颈,在A100和H100受限之后,A800/H800成为替代有谈判,但在算力和历练恶果上有有较大扣头。
▪️公司层面:原土AI玩家的主要风险在于地缘zz和芯片禁运,高度依赖国际的开源模子,更为严格的To-C端欺诈监管。
▪️监管要素:原土的大讲话模子审批经过是一一模子进行审批的,这将给面向公众的 C 端场景带来很高的进入壁垒,而面向 B 端的场景濒临较少的审查。
▪️原土算力:原土掌抓的算力随机荒谬50万块A100芯片,字节掌抓了最多AI作事器(约10万张A100),比较BAT愈加谨防模子作事(MaaS),专门愿成为IaaS提供者(历练/微调/推理等),2025年用于推理的GPU超历练用途。
▪️中好意思比较:中国在AI作事器或GPU、算法和LLM发挥、数据(鸠合仅2%为中语)、和欺诈场景上(C端付费意愿等)均在追逐,研发东说念主员成本比较好意思国更有上风。
▪️欺诈层契机:To-B欺诈有更明晰的变现阶梯,而To-C尚未考据;B端形状包括云作事(作事器算力租用;MaaS或Token数付费;API集顺利能付费;而C端尚不明晰,生意化仍在探索中(chatbox告白/商店开拓者收入分享/交游分红等)。
▪️模子层契机:进入模子供给充足或低ROI,通用模子由少数参与者主导,垂直模子有精深的参与者,巨头的上风在流量开首,LLM可整合到超等欺诈中,领有精深特稀零据的更有上风。
▪️基础方法层契机:BBAT会占据主导,GPU依然关节处所,历练和推理依赖于少数原土互联网巨头手脚具有MaaS才能的云超大限度提供商。三级片