AWS 今日通過(guò)其 SageMaker 和 S3 Tables 工具推出新服務(wù),承諾提供更加規(guī)范且具有成本效益的 AI 數(shù)據(jù)管道。
作為圓周率日貢獻(xiàn)的一部分,這家云計(jì)算巨頭宣布 SageMaker Unified Studio 正式發(fā)布。AWS 分析副總裁 Sirish Chandrasekaran 向 Blocks and Files 表示,這是一個(gè)集成了 AWS 數(shù)據(jù)分析和 AI/ML 服務(wù)的單一開(kāi)發(fā)環(huán)境。
它整合了該公司的 Lakehouse 平臺(tái)和作為治理層的 SageMaker Catalog。"通過(guò)這個(gè)工作室,你可以在同一個(gè)地方完成從 SQL、分析、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)集成、模型構(gòu)建到生成式 AI 應(yīng)用開(kāi)發(fā)的所有工作。"
他表示,SageMaker AI 增加了新模型,如 Claude 3.7 Sonnet 和 Deepseek R1。
"我們?yōu)?Anthropic、Meta 和 Amazon 的特定模型添加了對(duì)延遲敏感的推理功能。我們還簡(jiǎn)化了如何使用 Bedrock 來(lái)開(kāi)發(fā)原型應(yīng)用程序并在團(tuán)隊(duì)成員之間共享的方式。"
AWS 還宣布可以在 SageMaker Lakehouse 中訪問(wèn) S3 Tables。"現(xiàn)在你可以運(yùn)行 SQL、Spark 作業(yè)、模型構(gòu)建和生成式 AI 應(yīng)用。你可以將 S3 Table 數(shù)據(jù)與 Lakehouse 中的其他數(shù)據(jù)結(jié)合起來(lái),無(wú)論是在 Redshift 中的原生分區(qū) S3 數(shù)據(jù),還是本地和聯(lián)邦數(shù)據(jù)源,都可以整合在一起。"
他表示,這些都將幫助使用 AWS 服務(wù)的公司為其 AI 項(xiàng)目建立更好的數(shù)據(jù)基礎(chǔ)。
"我們的觀點(diǎn)是,差異化是通過(guò)數(shù)據(jù)實(shí)現(xiàn)的,因?yàn)槊總€(gè)現(xiàn)代企業(yè)都是數(shù)據(jù)企業(yè),而對(duì)你公司來(lái)說(shuō)獨(dú)特的就是你的數(shù)據(jù)。"
他說(shuō):"我們?cè)絹?lái)越多地看到,數(shù)據(jù)孤島正在減緩客戶的發(fā)展速度",這是因?yàn)樵谕晃恢脜R集數(shù)據(jù)或不同團(tuán)隊(duì)之間協(xié)作存在挑戰(zhàn)。同時(shí),在其他組織中,這些孤島正在變得模糊。
顯然,一些公司正在急于整合數(shù)據(jù)以投入 AI 領(lǐng)域。這引發(fā)了人們對(duì)傳統(tǒng)數(shù)據(jù)管理規(guī)范和技能被擱置的擔(dān)憂。Chandrasekaran 表示他看到的情況恰恰相反。"我從許多公司看到的是,他們現(xiàn)在意識(shí)到加快發(fā)展的方式是回歸基礎(chǔ)。"
"我們重新構(gòu)想 SageMaker Lakehouse 的很大一部分是能夠在數(shù)據(jù)所在位置進(jìn)行查詢。你現(xiàn)在不需要將數(shù)據(jù)從 Redshift 傳輸?shù)?S3 或從 S3 傳輸?shù)?Redshift。你可以從 Redshift 查詢 Lake 數(shù)據(jù)。"
他說(shuō)這減少了數(shù)據(jù)重復(fù),"這顯然可以節(jié)省成本,聯(lián)邦數(shù)據(jù)源也是如此。"
同時(shí)他表示,公司深刻意識(shí)到治理的需求,"但我認(rèn)為這個(gè)新世界的不同之處在于,治理不再僅僅是關(guān)于合規(guī)性。它關(guān)乎信心。"這包括對(duì) AI 項(xiàng)目使用和訓(xùn)練可信數(shù)據(jù)的信心,"以及對(duì)你的 AI 遵守負(fù)責(zé)任 AI 使用政策的信心。"