AWS雲端

🆕 Amazon Nova Multimodal Embeddings 上線

首個可同時處理文字、文件、影像、影片與音訊的嵌入模型，支援跨媒體語意搜尋與 Agentic RAG。

🔍 多模態語意理解
① 單一模型即可建立統一語意空間，整合多種資料型態。
② 支援 8K token 文字輸入與長影音切段處理。
③ 提供 4 種輸出維度（3072、1024、384、256），兼顧精度與效能。

🧩 開發與應用示例
① 可透過 Bedrock API 處理文字、影像、影片、音訊輸入並產生 embeddings。
② 支援同步與非同步呼叫，適合即時查詢與大量影音資料處理。
③ 結合 Amazon S3 Vectors 或 OpenSearch，可進行跨模態相似度搜尋。

🚀 可用性與整合
① 目前於 US East (N. Virginia) 提供，後續將拓展至其他區域。
② 已內建負責任 AI 與內容安全過濾機制。
③ 與 Amazon Q Developer、Kiro 等 AI 助理可透過 MCP Server 整合使用。

🔗 原始連結：https://aws.amazon.com/tw/blogs/aws/amazon-nova-multimodal-embeddings-now-available-in-amazon-bedrock/

最近貼文

reinvent

🆕AWS 每週技術更新｜2025/12/08

閱讀更多 »

用 S3 + Lambda 完成無伺服器化的全受管 AWS 架構

閱讀更多 »

AWS Reinforcement Fine-Tuning

🆕Amazon Bedrock 新功能上線｜Reinforcement Fine-Tuning

閱讀更多 »

文章分類

追蹤我們

如果想知道更多雲端新知，加入我們LINE@官方號