コンテンツ科学研究室

2020年11月10日: 松平茅隼君が「Imageability estimation using visual and language features」という題目の研究をICMR2020で発表しました.
2020年10月16日: 梅村和紀君の「Estimating the imageability of a sentence for image caption evaluation」という題目の論文がMMM2021で採択されました.
2020年9月14日: 梅村和紀君が「心像性に基づく画像キャプショニングの検討」という題目の研究でMVE賞を受賞しました.
2020年4月1日: コンテンツ科学研究室が独立しました.
人間の感覚を定量化するため単語の心像性推定について研究しています.
画像キャプションの実際に用いられる用途に応じたキャプションの生成を目指しています.
書籍を対象とし,ページ単位でその文書内容に応じた彩色を行なう手法について研究をしています.
歩容を擬態語で記述したり,逆に擬態語から歩容を生成したりするフレームワークの構築を目指しています.
調理動画に基づく調理の `上手さ' 評価実験. 益田菜々望. 東海関西データベースワークショップ2025, September 2025.
[解説]野外鳥類の行動解析のための視聴覚生態環境理解・解析技術. 中臺一博, 森本 元, 井手 一郎, 鈴木麗璽, 松林志保, 小島諒介. 電子情報通信学会誌, 108(9), pp.888-894, September 2025.
Stable Diffusionを用いた絵伝のアニメーション化に関する検討. 荒田涼太, 道満 恵介, 井手 一郎, 目加田 慶人. 電子情報通信学会技術研究報告(MVE), MVE2025-11, August 2025.
Leveraging Gradient-Based Pruning for Efficient Neural Networks in Crop Disease Detection. PADEIRO Carlos Victorino, 陳 則瑋, KOMAMIZU Takahiro, IDE Ichiro. 第28回画像の認識・理解シンポジウム(MIRU2025) 論文集, August 2025.
Exploring Unknown Image Generation for Zero Shot Learning via Diffusion Models. Lei Xiang, Yasutomo Kawanishi, Takahiro Komamizu, Ichiro Ide. Unknown Journal, IS3-079, August 2025.
Investigating conceptual blending of a diffusion model for improving nonword-to-image generation (ACMMM2024). 松平 茅隼, カストナー マークアウレル, Takahiro Komamizu, 平山 高嗣, 井手 一郎. 第28回画像の認識・理解シンポジウム(MIRU2025), IT3-06, August 2025.
Multi-proposal collaboration and multi-task training for weakly-supervised video moment retrieval. Bolin Zhang, Chao Yang, Bin Jiang, Takahiro Komamizu, Ichiro Ide. International Journal of Machine Learning and Cybernetics, Vol.16, 7-8, pp.4509-4524, August 2025.
MultiSensor-Home: Benchmark for Multi-modal Multi-view Action Recognition in Home Environments. Trung Thanh Nguyen, Yasutomo Kawanishi, Vijay John, Takahiro Komamizu, Ichiro Ide. Unknown Journal, IS3-038, August 2025.
Visual Adapter for Extracting Textually-related Features for Video Captioning. Junan Chen, Trung Thanh Nguyen, Takahiro Komamizu, Ichiro Ide. Unknown Journal, IS3-148, August 2025.
MLLM-based Dataset Construction for Hazard-aware Guidance for the Visually Impaired. Peiyuan ZHU, Marc A. Kastner, Hirotaka Kato, Takatsugu Hirayama, Takahiro Komamizu, Ichiro Ide. Unknown Journal, IS2-140, July 2025.