🆕 Amazon Nova Multimodal Embeddings 上線

Amazon Nova

首個可同時處理文字、文件、影像、影片與音訊的嵌入模型,支援跨媒體語意搜尋與 Agentic RAG。

🔍 多模態語意理解
① 單一模型即可建立統一語意空間,整合多種資料型態。
② 支援 8K token 文字輸入與長影音切段處理。
③ 提供 4 種輸出維度(3072、1024、384、256),兼顧精度與效能。

🧩 開發與應用示例
① 可透過 Bedrock API 處理文字、影像、影片、音訊輸入並產生 embeddings。
② 支援同步與非同步呼叫,適合即時查詢與大量影音資料處理。
③ 結合 Amazon S3 Vectors 或 OpenSearch,可進行跨模態相似度搜尋。

🚀 可用性與整合
① 目前於 US East (N. Virginia) 提供,後續將拓展至其他區域。
② 已內建負責任 AI 與內容安全過濾機制。
③ 與 Amazon Q Developer、Kiro 等 AI 助理可透過 MCP Server 整合使用。

🔗 原始連結:https://aws.amazon.com/tw/blogs/aws/amazon-nova-multimodal-embeddings-now-available-in-amazon-bedrock/

如果想知道更多雲端新知,加入我們LINE@官方號

感謝您的填寫,將有專人與您聯繫