探究使用多模态大模型对人类学影片实现以人为中心的影像的动作识别、抓取和理解。影视人类学积累的多元社会文化的海量视频数据,通过多模态大语言模型的处理和分析,可快速识别不同的标签场景,建立影像资料的元数据库,用于人类学教研和影像与文化的深入分析。
人类学影像库网站