

与美国、欧洲和中国相比,印度的AI模型产出一直相对滞后。目前仅有少数初创企业在发布模型,且大多集中在大语言模型或语音模型领域。为推动更多创新,印度政府启动了印度AI使命计划,这是一项规模约12亿美元的举措,核心内容之一是为入选的初创企业提供补贴算力资源,条件是企业须将其模型公开发布。Avataar AI是12家入选企业之一,近日推出了一款名为Varya的视频模型,该模型专为理解本地语境而设计,能够识别不同节日、食物及服饰等文化元素。
Avataar AI由知名投资机构Peak XV支持,专注于为电商场景提供视频创作工具。Varya并非从零构建,而是以阿里巴巴公开发布的视频生成模型Wan 2.2为基础,通过知识蒸馏技术——即将模型能力压缩为更精简、更快速的版本——针对Avataar的具体使用场景进行优化。最终成果是一个仅需四步即可完成推理的模型,而Wan 2.2需要50步,Varya的生成速度提升了10倍,成本也大幅降低。
Varya最引人注目的或许是其定价。该公司计划在托管服务上以每秒0.48印度卢比(约合0.005美元)的价格提供服务,远低于Veo、Kling、Luma、Runway等模型通常每秒0.10美元以上的收费标准,价格差距约达20倍。
印度是一个视频优先的市场。纵观印度所有头部消费互联网产品,视频的表现始终优于文字。当前的AI视频模型对于印度规模化应用而言成本过高。如果视频AI要真正触达学生、教师、中小微企业、创作者、企业及公共服务,成本必须大幅下降。成本是推动AI在印度普及的最关键突破口。Peak XV董事总经理Rajan Anandan在接受TechCrunch采访时表示。
图像和视频生成模型往往忽视文化细节,输出结果容易流于刻板印象或过于泛化——这一问题此前TechCrunch已有报道。Avataar AI表示,已通过精心筛选的数据对Varya进行训练,使其能够识别包括食物、服饰、建筑和节日在内的文化细节。
Varya将作为开放权重模型发布于印度政府搭建的AI Kosh平台——这是印度政府集中托管公开AI模型与数据集的统一平台——同时附带训练数据,开发者可自行部署或按需修改。Avataar还计划向企业客户开放该模型,并表示欢迎与Higgsfield、Adobe Firefly等视频工具展开合作。目前任何人均可通过官网,使用文字提示或参考图像进行体验。
Varya的发布折射出印度AI雄心背后的深层取舍。业界资深人士指出,印度在AI领域的优势路径在于打造应用产品与完善的开发者生态,而非与他国在基础模型层面正面竞争。这一务实选择背后有其现实原因:受限于算力不足与高质量数据匮乏,印度的模型研发进展明显慢于全球竞争对手。
印度AI使命也是政府弥合这一差距的更宏观战略布局的组成部分。去年,该计划遴选了包括Avataar AI在内的12家初创企业开展AI模型研发,并为其提供低成本算力支持。今年早些时候,印度信息技术部长Ashwini Vaishnaw表示,印度的目标是到2028年吸引2000亿美元的AI投资,并在六个月内将GPU算力容量翻倍以上。
A:Varya并非从头训练,而是基于阿里巴巴开源的Wan 2.2模型,通过知识蒸馏技术进行压缩和优化,将推理步骤从50步缩减至4步,生成速度提升10倍,成本大幅降低。托管服务定价为每秒0.48印度卢比(约0.005美元),而Veo、Runway等模型通常每秒收费0.10美元以上,价格差距约20倍。
A:Avataar AI通过精心筛选的本土数据对Varya进行专项训练,使模型能够识别印度特有的文化元素,包括本地节日、传统服饰、特色食物和建筑风格等,从而避免通用视频生成模型常见的文化失真或刻板化输出问题。
A:可以。Varya将作为开放权重模型发布在印度政府的AI Kosh平台上,并附带训练数据,开发者可以自行部署或二次修改。目前任何人都可以在Avataar官网通过文字提示或参考图像直接体验该模型。