本项目是基于paarthneekhara/neural-vqa-tensorflow的英文VQA项目
1.环境为:
python2.7
tensorflow1.6
jieba分词
2.数据为:
MsCOCO 2014图片数据: http://cocodataset.org/#download
预训练的VGG16模型: https://github.com/ry/tensorflow-vgg16
百度的中文人工标注数据FM-IQA: http://idl.baidu.com/FM-IQA.html
3.FM-IQA问答样例
笔记本的品牌是什么(中英文都要标注)?苹果(Apple)。
他们在用什么电脑?苹果电脑。
笔记本电脑放在木箱子上面么?是的。
电脑在哪里?桌上的箱子上。
这是什么?电脑。
小孩子的衣服是什么颜色?是橘黄色。
今天天气怎么样?晴朗。
这花瓶是什么颜色的?这花瓶是蓝色的。
这个电陶炉有几个灶头?4个。
这人的眼镜框是黑色的吗?是的。
座钟边有椅子吗?是的有椅子。
拿手机的女人在干嘛?她在拍照。
这是在草地上么?是的。