発表文献 | 複合知能メディア研究室

発表文献

2026

論文誌

Xinpeng Liu, Hiroaki Santo, Yosuke Toda, Fumio Okura (2026). PlantPose: Universal plant skeleton estimation via tree-constrained graph generation. International Journal of Computer Vision.

引用 DOI

Lilika Makabe, Kohei Ashida, Hiroaki Santo, Fumio Okura, Yasuyuki Matsushita (2026). DP-SfM: Dual-pixel structure-from-motion without scale ambiguity. IEEE Transactions on Pattern Analysis and Machine Intelligence.

引用 DOI

Ryota Fujii, Akichika Nakashima, Hiroaki Santo, Toshiyasu Kinari, Fumio Okura (2026). Empirical hyperelastic modeling of textile fabrics for measuring nonlinear bending rigidity. Engineering with Computers.

引用 DOI

Weng Ian Chan, Hiroaki Santo, Yasuyuki Matsushita, Fumio Okura (2026). Instance-wise distribution control of text-to-image diffusion models. Pattern Recognition.

引用 DOI

Tongyu Yang, Heng Guo, Yasuyuki Matsushita, Fumio Okura, Yu Luo, Xin Fan (2026). High-fidelity multi-view normal integration with scale-encoded neural surface representations. Computer Graphics Forum.

引用 DOI

Yang Yang, Ren Nakagawa, Risa Shinoda, Hiroaki Santo, Kenji Oyama, Takenao Ohkawa, Fumio Okura (2026). Talking with Actionbits---A part-enhanced VLM for action and interaction recognition in animals. Sensors.

引用 DOI

書籍

山岸順一, 馬場口登, 笹原和俊, 中島悠太, 西田宗千佳越前功 (2026). ``ディープフェイクー生成AIとの共棲に向けて,'' 丸善ライブラリー392. 丸善出版.

引用

国際会議

Zaiyan Yang, Xinpeng Liu, Heng Guo, Jinglei Shi, Zhanyu Ma, Fumio Okura (2026). NRGS: Neural regularization for robust 3D semantic Gaussian splatting. Proc. the IEEE International Conference on Multimedia and Expo (ICME2026).

引用

Risa Shinoda, Kaede Shiohara, Nakamasa Inoue, Kuniaki Saito, Hiroaki Santo, Fumio Okura (2026). BioVITA: Biological dataset, model, and benchmark for visual-textual-acoustic alignment. Proc. the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2026).

引用

Risa Shinoda, Kaede Shiohara, Nakamasa Inoue, Hiroaki Santo, Fumio Okura (2026). AnimalCLAP: Taxonomy-aware language-audio pretraining for species recognition and trait inference. Proc. the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2026).

引用

Xinpeng Liu, Fumio Okura (2026). Gaussian mesh renderer for lightweight differentiable rendering. Proc. the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2026).

引用

Ryohei Goto, Takuya Fujihashi, Shunsuke Saruwatari, Fumio Okura (2026). Unsupervised 3D human pose estimation via conditional multi-view ancestral sampling. Proc. the IEEE International Conference on Automatic Face and Gesture Recognition (FG2026).

引用

Ren Nakagawa, Yang Yang, Risa Shinoda, Hiroaki Santo, Kenji Oyama, Fumio Okura, Takenao Ohkawa (2026). Interaction-via-Actions: Cattle interaction detection with joint learning of action-interaction latent space. Proc. the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV2026).

引用

Liyun Zhang, Zheng Lian, Hong Liu, Takanori Takebe, Shozo Nishii, Yuta Nakashima (2026). QuMAB: Query-based Multi-annotator Behavior Pattern Learning. Proc. the AAAI Conference on Artificial Intelligence (AAAI2026).

引用 DOI

Liyun Zhang, Zheng Lian, Hong Liu, Takanori Takebe, Yuta Nakashima (2026). SimLabel: Similarity-Weighted Semi-supervision for Multi-annotator Learning with Missing Labels. Proc. the AAAI Conference on Artificial Intelligence (AAAI2026).

引用 DOI

Junhao Xing, Ryohei Miyakawa, Yang Yang, Xinpeng Liu, Risa Shinoda, Hiroaki Santo, Yosuke Toda, Fumio Okura (2026). Zero-shot hierarchical plant segmentation via foundation segmentation models and text-to-image attention. Proc. the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV2026).

引用

招待講演

中島悠太 (2026). LLMの光と闇？推論エンジンとしてのLLMとバイアス. 情報処理学会コンピュータビジョンとイメージメディア研究会 (第244回).

引用

2025

論文誌

Jiahao Zhang, Shoya Wada, Kento Sugimoto, Takayuki Niitsu, Kiyoharu Fukushima, Hiroshi Kida, Bowen Wang, Shozo Konishi, Katsuki Okada, Yuta Nakashima, Toshihiro Takeda (2025). ILD-Slider: A Parameter-Efficient Model for Identifying Progressive Fibrosing Interstitial Lung Disease from Chest CT Slices. Journal of Imaging.

引用 DOI URL

Naoki Asada, Xinpeng Liu, Kanyu Xu, Ryohei Miyakawa, Yang Yang, Hiroaki Santo, Yosuke Toda, Fumio Okura (2025). LeafGen: Structure-aware leaf image generation for annotation-free leaf instance segmentation. Plant Phenomics.

引用 DOI

Jiahao Zhang, Bowen Wang, Hong Liu, Liangzhi Li, Yuta Nakashima, Hajime Nagahara (2025). E-InMeMo: Enhanced Prompting for Visual In-Context Learning. Journal of Imaging.

引用 DOI URL

Xinpeng Liu, Kanyu Xu, Risa Shinoda, Hiroaki Santo, Fumio Okura (2025). Masks-to-Skeleton: Multi-view mask-based tree skeleton extraction with 3D Gaussian splatting. Sensors.

引用 DOI

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2025). Mitigating Gender Bias in Captioning Systems. IEICE Transactions on Information and Systems.

引用 DOI URL

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2025). Societal Bias in Image Captioning: Identifying and Measuring Bias Amplification. IEICE Transactions on Information and Systems.

引用 DOI URL

Hugo Lemarchant, Hong Liu, Yuta Nakashima (2025). RobustQuote: Using Reference Images for Adversarial Robustness. Applied Sciences.

引用 DOI URL

Yiming Qian, Cheikh Brahim El Vaigh, Yuta Nakashima, Benjamin Renoust, Hajime Nagahara, Yutaka Fujioka (2025). Built year prediction of Buddha face with heterogeneous label modeled as probabilistic distribution. Multimedia Tools and Applications.

引用 DOI URL

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2025). PixCon: Pixel-Level Contrastive Learning Revisited. Electronics.

引用 DOI URL

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2025). Text-Guided Diverse Scene Interaction Synthesis by Disentangling Actions from Scenes. IEEE Access.

引用 DOI URL

Cheikh Brahim El Vaigh, Noa Garcia, Benjamin Renoust, Chenhui Chu, Yuta Nakashima, Yiming Qian, Hajime Nagahara (2025). GNNBoost: boosting artwork classification with graph embeddings. Multimedia Tools and Applications.

引用 DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia (2025). Revealing Gender Bias from Prompt to Image in Stable Diffusion. Journal of Imaging.

引用 DOI URL

国際会議

Shunsuke Ichimiya, Yuta Nakashima (2025). A Needle in a Haystack: Finding Contextual Knowledge for Video Question Answering. Proc. the Asian Conference on Pattern Recognition (ACPR2025).

引用 DOI

Yusuke Hirota, Ryo Hachiuma, Boyi Li, Ximing Lu, Michael Ross Boone, Boris Ivanovic, Yejin Choi, Marco Pavone, Yu-Chiang Frank Wang, Noa Garcia, Yuta Nakashima, Chao-Han Huck Yang (2025). Bias in Gender Bias Benchmarks: How Spurious Features Distort Evaluation. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

引用

Ryan Ramos, Yusuke Hirota, Yuta Nakashima, Noa Garcia (2025). From Global to Local: Social Bias Transfer in CLIP. Proc. the IEEE/CVF International Conference on Computer Vision Workshops (ICCVW2025).

引用

Yang Yang, Dongni Mao, Hiroaki Santo, Yasuyuki Matsushita, Fumio Okura (2025). NeuraLeaf: Neural parametric leaf models with shape and deformation disentanglement. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

引用

Rawisara Lohanimit, Yankun Wu, Amelia Katirai, Yuta Nakashima, Noa Garcia (2025). Privacy in Image Datasets: A Case Study on Pregnancy Ultrasounds. Proc. the AAAI/ACM Conference on AI, Ethics, and Society (AIES-25).

引用 DOI

Ryan Ramos, Vladan Stojnić, Giorgos Kordopatis-Zilos, Yuta Nakashima, Giorgos Tolias, Noa Garcia (2025). Processing and acquisition traces in visual encoders: What does CLIP know about your camera?. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

引用

Lilika Makabe, Hiroaki Santo, Fumio Okura, Michael S. Brown, Yasuyuki Matsushita (2025). Spectral sensitivity estimation with an uncalibrated diffraction grating. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

引用

Bowen Wang, Zhouqiang Jiang, Yasuaki Susumu, Shotaro Miwa, Tianwei Chen, Yuta Nakashima (2025). Taming the Untamed: Graph-Based Knowledge Retrieval and Reasoning for MLLMs to Conquer the Unknown. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

引用

Jovana Panic, Atsushi Watanabe, Hideaki Hayashi, Yuta Nakashima, Kohji Nishida, Hajime Nagahara (2025). Impact of Experimental Design in Age Prediction from Retinal Fundus Images. Proc. the 47th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC2025).

引用 DOI

Yusuke Hirota, Boyi Li, Ryo Hachiuma, Yueh-Hua Wu, Boris Ivanovic, Marco Pavone, Yejin Choi, Yu-Chiang Frank Wang, Yuta Nakashima, Chao-Han Huck Yang (2025). LOTUS: A Leaderboard for Detailed Image Captioning from Quality to Societal Bias and User Preferences. Proc. the 63rd Annual Meeting of the Association for Computational Linguistics (ACL2025).

引用 DOI

Xinpeng Liu, Zeyi Huang, Fumio Okura, Yasuyuki Matsushita (2025). HoGS: Unified near and far object reconstruction via homogeneous gaussian splatting. Proc. the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2025).

引用 DOI

Risa Kondo, Ayu Teramen, Reon Kajikawa, Koki Horiguchi, Tomoyuki Kajiwara, Takashi Ninomiya, Hideaki Hayashi, Yuta Nakashima, Hajime Nagahara (2025). Text Normalization for Japanese Sentiment Analysis. Proc. the Tenth Workshop on Noisy and User-generated Text (W-NUT 2025).

引用 DOI

Junhao Chen, Bowen Wang, Zhouqiang Jiang, Yuta Nakashima (2025). Putting People in LLMs’ Shoes: Generating Better Answers via Question Rewriter. Proc. the AAAI Conference on Artificial Intelligence.

引用 DOI

Patrick Ramos, Nicolas Gonthier, Selina Khan, Yuta Nakashima, Noa Garcia (2025). No Annotations for Object Detection in Art through Stable Diffusion. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

引用 DOI

Hong Liu, Yuta Nakashima, Noboru Babaguchi (2025). PALADIN: Understanding Video Intentions in Political Advertisement Videos. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

引用 DOI

Zhouqiang Jiang, Bowen Wang, Junhao Chen, Yuta Nakashima (2025). Relayout: Towards real-world document understanding via layout-enhanced pre-training. Proc. the 31st International Conference on Computational Linguistics (Coling2025).

引用

招待講演

Yuta Nakashima (2025). Graphs as Knowledge Representation. The 3rd Workshop on Scene Graphs and Graph Representation Learning at ICCV2025.

引用

2024

論文誌

Ziyu Guan, Wanqing Zhao, Hongmin Liu, Yuta Nakashima, Noboru Babaguchi, Xiaofei He (2024). Cross-modal Guided Visual Representation Learning for Social Image Retrieval. IEEE Transactions on Pattern Analysis and Machine Intelligence.

引用 DOI URL

Tianwei Chen, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima, Hajime Nagahara (2024). Learning More May Not Be Better: Knowledge Transferability in Vision-and-Language Tasks. Journal of Imaging.

引用 DOI URL

Yusuke Hirota, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima (2024). A picture may be worth a hundred words for visual question answering. Electronics.

引用 DOI URL

Yiming Qian, Liangzhi Li, Yuta Nakashima, Hajime Nagahara, Kohji Nishida, Ryo Kawasaki (2024). Is cardiovascular risk profiling from UK Biobank retinal images using explicit deep learning estimates of traditional risk factors equivalent to actual risk measurements? A prospective cohort study design. BMJ Open.

引用 DOI URL

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2024). Unleashing the Power of Contrastive Learning for Zero-Shot Video Summarization. Journal of Imaging.

引用 DOI URL

Amelia Katirai, Noa Garcia, Kazuki Ide, Yuta Nakashima, Atsuo Kishimoto (2024). Situating the social issues of image generation models in the model life cycle: a sociotechnical approach. AI and Ethics.

引用 DOI URL

Amelia Katirai Noa Garcia Kazuki Ide Yuta Nakashima, Atsuo Kishimoto (2024). Situating the social issues of image generation models in the model life cycle: a sociotechnical approach. AI and Ethics.

引用 DOI URL

Tianwei Chen, Noa Garcia, Liangzhi Li, Yuta Nakashima (2024). Exploring Emotional Stimuli Detection in Artworks: A Benchmark Dataset and Baselines Evaluation. Journal of Imaging.

引用 DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia (2024). GOYA: Leveraging Generative Art for Content-Style Disentanglement. Journal of Imaging.

引用 DOI URL

Bowen Wang, Jiaxin Zhang, Ran Zhang, Yunqin Li, Liangzhi Li, Yuta Nakashima (2024). Improving facade parsing with vision transformers and line integration. Advanced Engineering Informatics.

引用 DOI URL

書籍

廣田裕亮, Noa Garcia 中島悠太 (2024). ``カヨミAI に潜むバイアス,'' コンピュータビジョン最前線 Spring 2024. 共立出版.

引用

国際会議

Bowen Wang, Jiuyang Chang, Yiming Qian, Guoxin Chen, Junhao Chen, Zhouqiang Jiang, Jiahao Zhang, Yuta Nakashima, Hajime Nagahara (2024). DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models. Proc. Thirty-Eighth Annual Conference on Neural Information Processing Systems (NeurIPS).

引用

Yusuke Hirota, Ryo Hachiuma, Chao-Han Huck Yang, Yuta Nakashima (2024). From Descriptive Richness to Bias: Unveiling the Dark Side of Generative Image Caption Enrichment. Proc. 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP).

引用

Yusuke Hirota, Jerone TA Andrew, Dora Zhao, Orestis Papakyriakopoulos, Apostolos Modas, Yuta Nakashima, Alice Xiang (2024). Resampled Datasets Are Not Enough: Mitigating Societal Bias Beyond Single Attributes. Proc. 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP).

引用

Liyun Zhang, Zhaojie Luo Amd Shuqiong Wu, Yuta Nakashima (2024). MicroEmo: Time-Sensitive Multimodal Emotion Recognition with Subtle Clue Dynamics in Video Dialogues. Proc. 2nd International Workshop on Multimodal and Responsible Affective Computing.

引用 DOI

Yankun Wu, Yuta Nakashima, Noa Garcia (2024). Stable Diffusion Exposed: Gender Bias from Prompt to Image. Proc. AAAI/ACM Conference on AI, Ethics, and Society.

引用

Warren Leu, Yuta Nakashima, Noa Garcia (2024). Auditing Image-based NSFW Classifiers for Content Filtering. Proc. ACM Conference on Fairness, Accountability, and Transparency (FAccT).

引用 DOI URL

Tianwei Chen, Yusuke Hirota, Mayu Otani, Noa Garcia, Yuta Nakashima (2024). Would Deep Generative Models Amplify Bias in Future Models?. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia, Sheng Li, Zhaoyang Zeng (2024). Reproducibility Companion Paper: Stable Diffusion for Content-Style Disentanglement in Art Analysis. Proc. 2024 International Conference on Multimedia Retrieval (ICMR).

引用 DOI URL

Tianwei Chen, Noa Garcia, Liangzhi Li, Yuta Nakashima (2024). Retrieving Emotional Stimuli in Artworks. Proc. 2024 International Conference on Multimedia Retrieval (ICMR).

引用 DOI URL

Jiahao Zhang, Bowen Wang, Liangzhi Li, Yuta Nakashima, Hajime Nagahara (2024). Instruct me more! Random prompting for visual in-context learning. Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV).

引用 DOI URL

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2024). Revisiting pixel-level contrastive pre-training on scene images. Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV).

引用 DOI URL

招待講演

中島悠太 (2024). 深層学習に潜むバイアス～ビジョンと言語のタスクを中心に～. 第30回画像センシングシンポジウム.

引用

Yuta Nakashima (2024). Mitigating social bias in image captioning models. The 30th International Workshop on Frontiers of Computer Vision.

引用

2023

論文誌

Yuta Nakashima, Yusuke Hirota, Yankun Wu, Noa Garcia (2023). Societal Bias in Vision-and-Language Datasets and Models. Journal of the Imaging Society of Japan.

引用 DOI URL

Yasutaka Okita, Toru Hirano, Bowen Wang, Yuta Nakashima, Saki Minoda, Hajime Nagahara, Atsushi Kumanogoh (2023). Automatic evaluation of atlantoaxial subluxation in rheumatoid arthritis by a deep learning model. Arthritis Research & Therapy.

引用 DOI URL

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2023). ACT2G: Attention-based Contrastive Learning for Text-to-Gesture Generation. Proceedings of the ACM on Computer Graphics and Interactive Techniques.

引用 DOI URL

Zekun Yang, Yuta Nakashima, Haruo Takemura (2023). Multi-modal humor segment prediction in video. Multimedia Systems.

引用 DOI URL

Bowen Wang, Liangzhi Li, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2023). Real-time estimation of the remaining surgery duration for cataract surgery using deep convolutional neural networks and long short-term memory. BMC Medical Informatics and Decision Making.

引用 DOI URL

Kiichi Goto, Taikan Suehara, Tamaki Yoshioka, Masakazu Kurata, Hajime Nagahara, Yuta Nakashima, Noriko Takemura, Masako Iwasaki (2023). Development of a vertex finding algorithm using recurrent neural network. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment.

引用 DOI URL

国際会議

Wanqing Zhao, Yuta Nakashima, Haiyuan Chen, Noboru Babaguchi (2023). Enhancing Fake News Detection in Social Media via Label Propagation on Cross-Modal Tweet Graph. Proc. ACM International Conference on Multimedia (MM).

引用 DOI URL

Bowen Wang, Liangzhi Li, Yuta Nakashima, Hajime Nagahara (2023). Learning bottleneck concepts in image classification. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI URL

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2023). Model-agnostic gender debiased image captioning. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia (2023). Not only generative art: Stable diffusion for content-style disentanglement in art analysis. Proc. 2023 ACM International Conference on Multimedia Retrieval (ICMR).

引用 DOI URL

Mayu Otani, Riku Togashi, Yu Sawai, Ryosuke Ishigami, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Shin’ichi Satoh (2023). Toward verifiable and reproducible human evaluation for text-to-image generation. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI URL

Noa Garcia, Yusuke Hirota, Yankun Wu, Yuta Nakashima (2023). Uncurated image-text datasets: Shedding light on demographic bias. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI URL

Hugo Lemarchant, Liangzi Li, Yiming Qian, Yuta Nakashima, Hajime Nagahara (2023). Inference Time Evidences of Adversarial Attacks for Forensic on Transformers. Proc. AAAI-23 Workshop on Artificial Intelligence for Cyber Security (AICS).

引用

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2023). Contrastive Losses Are Natural Criteria for Unsupervised Video Summarization. Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV).

引用 DOI URL

招待講演

中島悠太 (2023). Vision and Language の現状とバイアス. 第22回情報科学技術フォーラム.

引用

Yuta Nakashima (2023). Concept discovery from an image dataset: Toward image representation with an emergent language. Seventh International Workshop on Symbolic-Neural Learning.

引用

Yuta Nakashima (2023). Explainability matters in medical applications. SCAI-IDS Workshop 2023.

引用

Yuta Nakashima (2023). Toward better communication between humans and AI: What do neural networks see?. Workshop IIT-Osaka University–Towards Symbiotec Society with Multi-species: Humans, Robots, and Avatars.

引用

中島悠太 (2023). ディープニューラルネットワークのための説明可能な識別器. 画像ラボ.

引用

2022

論文誌

Koji Tanaka, Chenhui Chu, Tomoyuki Kajiwara, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2022). Corpus Construction for Historical Newspapers: A Case Study on Public Meeting Corpus Construction Using OCR Error Correction. SN Computer Science.

引用 DOI URL

Sudhakar Kumawat, Manisha Verma, Yuta Nakashima, Shanmuganathan Raman (2022). Depthwise spatio-temporal STFT convolutional neural networks for human action recognition. IEEE Trans. Pattern Analysis and Machine Intelligence.

引用 DOI URL

Bowen Wang, Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2022). Match them up: Visually explainable few-shot image classification. Applied Intelligence.

引用 DOI

Felix Giovanni Virgo, Chenhui Chu, Takaya Ogawa, Koji Tanaka, Kazuki Ashihara, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2022). Information Extraction from Public Meeting Articles. SN Computer Science.

引用 DOI

Zhenzhong Kuang, Longbin Teng, Xingchi He, Jiajun Ding, Yuta Nakashima, Noboru Babaguchi (2022). Anonymous identity sampling and reusable synthesis for sensitive face camouflage. Journal of Electronic Imaging.

引用 DOI

国際会議

Haruya Suzuki, Sora Tarumoto, Tomoyuki Kajiwara, Takashi Ninomiya, Yuta Nakashima, Hajime Nagahara (2022). Emotional Intensity Estimation based on Writer’s Personality. Proc. 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (AACL-IJCNJP): Student Research Workshop.

引用

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2022). Deep Gesture Generation for Social Robots Using Type-Specific Libraries. Proc. 2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).

引用 DOI URL

Manisha Verma, Yuta Nakashima, Noriko Takemura, Hajime Nagahara (2022). Multi-label disengagement and behavior prediction in online learning. Proc. International Conference on Artificial Intelligence in Education.

引用 DOI URL

Haruya Suzuki, Yuto Miyauchi, Kazuki Akiyama, Tomoyuki Kajiwara, Takashi Ninomiya, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2022). A Japanese Dataset for Subjective and Objective Sentiment Polarity Classification in Micro Blog Domain. Proc. Thirteenth Language Resources and Evaluation Conference (LREC).

引用

Riku Togashi, Mayu Otani, Yuta Nakashima, Janne Heikkilä Esa Rahtu, Tetsuya Sakai (2022). AxIoU: An Axiomatically Justified Measure for Video Moment Retrieval. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2022). Gender and racial bias in visual question answering datasets. Proc. ACM Conference on Fairness, Accountability, and Transparency (FAccT).

引用 DOI

Mayu Otani, Riku Togashi, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Shin'ichi Satoh (2022). Optimal Correction Cost for Object Detection Evaluation. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2022). Quantifying Societal Bias Amplification in Image Captioning. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI

Anh-Khoa Vo, Yuta Nakashima (2022). Tone Classification for Political Advertising Video using Multimodal Cues. Proc. 3rd ACM Workshop on Intelligent Cross-Data Analysis and Retrieval.

引用 DOI URL

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, David Baumert, Hiroshi Kawasaki, Katsushi Ikeuchi (2022). Integration of gesture generation system using gesture library with DIY robot design kit. Proc. IEEE/SICE International Symposium on System Integration (SII).

引用 DOI

招待講演

Yuta Nakashima (2022). Foundation of AI . The 5th International School on Beam Dynamics and Accelerator Technology.

引用

Yuta Nakashima (2022). What do models see? Bias in neural networks. The 24th Academic Exchange Seminar Between Shanghai Jiao Tong University and Osaka University.

引用

中島悠太 (2022). 深層学習の最近の話題と医療分野への応用. 日本眼光学会総会シンポジウム2: AI の夢.

引用

中島悠太 (2022). 分野を超えた人工知能研究と最新の話題について. 大阪国際サイエンスクラブ第13回若手学識者との異分野交流会.

引用

Yuta Nakashima (2022). Recent Machine Learning Techniques and Exploration of New Physics. Physics in LHC and Beyond.

引用

中島悠太 (2022). 深層学習入門. レーザー研究.

引用

李良知, 王博文中島悠太 (2022). AI の信頼性を高めるExplainable AI. 映像情報メディア学会誌.

引用

2021

論文誌

Chenhui Chu, Vinicius Oliveira, Felix Giovanni Virgo, Mayu Otani, Noa Garcia, Yuta Nakashima (2021). The semantic typology of visually grounded paraphrases. Computer Vision and Image Understanding.

引用 DOI

Zekun Yang, Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima, Haruo Takemura (2021). A comparative study of language Transformers for video question answering. Neurocomputing.

引用 DOI URL

Bowen Wang, Liangzhi Li, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara, Yasushi Yagi (2021). Noisy-LSTM: Improving temporal awareness for video semantic segmentation. IEEE Access.

引用 DOI URL

Noboru Babaguchi, Isao Echizen, Junichi Yamagishi, Naoko Nitta, Yuta Nakashima, Kazuaki Nakamura, Kazuhiro Kono, Fuming Fang, Seiko Myojin, Zhenzhong Kuang, Huy H.~Nguyen, Ngoc-Dung T.~Tieu (2021). Generation and detection of media clones. IEICE Trans. Information and Systems.

引用 DOI

Noboru Babaguchi, Isao Echizen, Junichi Yamagishi, Naoko Nitta, Yuta Nakashima, Kazuaki Nakamura, Kazuhiro Kono, Fuming Fang, Seiko Myojin, Zhenzhong Kuang, Huy H.~Nguyen, Ngoc-Dung T.~Tieu (2021). Preventing fake information generation against media clone attacks. IEICE Trans. Information and Systems.

引用 DOI

国際会議

Zechen Bai, Yuta Nakashima, Noa Garcia (2021). Explain me the painting: Multi-topic knowledgeable art description generation. Proc. IEEE/CVF International Conference on Computer Vision (ICCV).

引用 DOI

Cheikh Brahim El Vaigh, Noa Garcia, Benjamin Renoust, Chenhui Chu, Yuta Nakashima, Hajime Nagahara (2021). GCNBoost: Artwork Classification by Label Propagation Through a Knowledge Graph. Proc. ACM International Conference on Multimedia Retrieval (ICMR).

引用 DOI

Bowen Wang, Liangzhi Li, Yuta Nakashima, Takehiro Yamamoto, Hiroaki Ohshima, Yoshiyuki Shoji, Kenro Aihara, Noriko Kando (2021). Image Retrieval by Hierarchy-aware Deep Hashing Based on Multi-task Learning. Proc. ACM International Conference on Multimedia Retrieval (ICMR).

引用 DOI

Liangzhi Li, Bowen Wang, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2021). SCOUTER: Slot attention-based classifier for explainable image recognition. Proc. IEEE/CVF International Conference on Computer Vision (ICCV).

引用 DOI

Tianran Wu, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima, Haruo Takemura (2021). Transferring domain-agnostic knowledge in video question answering. Proc. British Machine Vision Conference (BMVC).

引用

Yiming Qian, Cheikh Brahim El Vaigh, Yuta Nakashima, Benjamin Renoust, Hajime Nagahara, Yutaka Fujioka (2021). Built year prediction from Buddha face with heterogeneous labels. Proc. Workshop on Structuring and Understanding of Multimedia Heritage Contents (SUMAC).

引用

Yusuke Hirota, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima, Ittetsu Taniguchi, Takao Onoye (2021). Visual question answering with textual representations for images. Proc. IEEE/CVF International Conference on Computer Vision Workshops (ICCVW).

引用 DOI

Manisha Verma, Yuta Nakashima, Hirokazu Kobori, Ryota Takaoka, Noriko Takemura, Tsukasa Kimura, Hajime Nagahara, Masayuki Numao, Kazumitsu Shinohara (2021). Learners' efficiency prediction using facial behavior analysis. Proc. International Conference on Image Processing (ICIP).

引用 DOI

Yoshiyuki Shoji, Kenro Aihara, Noriko Kando, Yuta Nakashima, Hiroaki Ohshima, Shio Takidaira, Masaki Ueta, Takehiro Yamamoto, Yusuke Yamamoto (2021). Museum Experience into a Souvenir: Generating Memorable Postcards from Guide Device Behavior Log. Proc. ACM/IEEE Joint Conference on Digital Libraries (JCDL).

引用 DOI

Akihiko Sayo, Diego Thomas, Hiroshi Kawasaki, Yuta Nakashima, Katsushi Ikeuchi (2021). PoseRN: A 2D pose refinement network for bias-free multi-view 3D human pose estimation. Proc. International Conference on Image Processing (ICIP).

引用 DOI

Jules Samaran, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima (2021). Attending self-attention: A case study of visually grounded supervision in vision-and-language transformers. Proc. Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: Student Research Workshop.

引用 DOI

Bowen Wang, Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2021). MTUNet: Few-shot image classification with visual explanations. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

引用 DOI

Tomoyuki Kajiwara, Chenhui Chu, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2021). WRIME: A new dataset for emotional intensity estimation with subjective and objective annotations. Proc. Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT).

引用 DOI

Yuta Kayatani, Zekun Yang, Mayu Otani, Noa Garcia, Chenhui Chu, Yuta Nakashima, Haruo Takemura (2021). The laughing machine: Predicting humor in video. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

引用 DOI

招待講演

中島悠太 (2021). 機械は世界をどう見ているのか？. 第3回【おウチで】大阪大学ロボットサイエンスカフェ.

引用

2020

論文誌

Noa Garcia, Benjamin Renoust, Yuta Nakashima (2020). ContextNet: Representation and exploration for painting classification and retrieval in context. International Journal on Multimedia Information Retrieval.

引用 DOI

Wenjian Dong, Mayu Otani, Noa Garcia, Yuta Nakashima, Chenhui Chu (2020). Cross-lingual visual grounding. IEEE Access.

引用 DOI

Kazuki Ashihara, Cheikh Brahim El Vaigh, Chenhui Chu, Benjamin Renoust, Noriko Okubo, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2020). Improving topic modeling through homophily for legal documents. Applied Network Science.

引用 DOI

Mayu Otani, Chenhui Chu, Yuta Nakashima (2020). Visually grounded paraphrase identification via gating and phrase localization. Neurocomputing.

引用 DOI

Tsukasa Kimura, Noriko Takemura, Yuta Nakashima, Hirokazu Kobori, Hajime Nagahara, Masayuki Numao, Kazumitsu Shinohara (2020). Warmer environments increase implicit mental workload even if learning efficiency is enhanced. Frontiers in Psychology.

引用 DOI

Yuta Nakashima, Takaaki Yasui, Leon Nguyen, Noboru Babaguchi (2020). Speech-driven face reenactment for a video sequence. ITE Trans. Media Technology and Applications.

引用 DOI

国際会議

Sora Ohashi, Tomoyuki Kajiwara, Chenhui Chu, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2020). IDSOU at WNUT-2020 Task 2: Identification of informative COVID-19 English tweets. Proc. Workshop on Noisy User-Generated Text (W-NUT).

引用 URL

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2020). Uncovering hidden challenges in query-based video moment retrieval. Proc. British Machine Vision Conference (BMVC).

引用

Noa Garcia, Chentao Ye, Zihua Liu, Qingtao Hu, Mayu Otani, Chenhui Chu, Yuta Nakashima, Teruko Mitamura (2020). A dataset and baselines for visual question answering on art. Proc. European Conference on Computer Vision Workshops (VISARTS).

引用 DOI

Nikolai Huckle, Noa Garcia, Yuta Nakashima (2020). Demographic Influences on Contemporary Art with Unsupervised Style Embeddings. Proc. European Conference on Computer Vision Workshops (VISARTS).

引用 DOI

Noa Garcia, Yuta Nakashima (2020). Knowledge-based video question answering with unsupervised scene descriptions. Proc. European Conference on Computer Vision (ECCV).

引用 DOI

Zhiqiang Guo, Huigui Liu, Zhenzhong Kuang, Yuta Nakashima, Noboru Babaguchi (2020). Privacy sensitive large-margin model for face de-identification. Proc. International Conference on Neural Computing for Advanced Applications (NCAA).

引用 URL

Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2020). Joint learning of vessel segmentation and artery/vein classification with post-processing. Proc. Medical Imaging with Deep Learning (MIDL).

引用

Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima (2020). Knowledge-Based Visual Question Answering in Videos. Proc. Workshop on Women in Computer Vision.

引用

Manisha Verma, Sudhakar Kumawat, Yuta Nakashima, Shanmuganathan Raman (2020). Yoga-82: A new dataset for fine-grained classification of human poses. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

引用 DOI URL

Koji Tanaka, Chenhui Chu, Haolin Ren, Benjamin Renoust, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2020). Constructing a public meeting corpus. Proc. Conference on Language Resources and Evaluation (LREC).

引用

Zekun Yang, Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima, Haruo Takemura (2020). BERT representations for video question answering. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

引用 DOI

Liangzhi Li, Manisha Verma, Yuta Nakashima, Hajime Nagahara, Ryo Kawasaki (2020). IterNet: Retinal image segmentation utilizing structural redundancy in vessel networks. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

引用 DOI

Yuta Nakashima, Hirokazu Kobori, Ryota Takaoka, Noriko Takemura, Tsukasa Kimura, Hajime Nagahara, Masayuki Numao, Kazumitsu Shinohara (2020). Toward predicting learners' efficiency for adaptive e-learning. Proc. International Learning Analytics and Knowledge Conference (LAK).

引用

Mehrasa Alizadeh, Shizuka Shirai, Noriko Takemura, Shogo Terai, Yuta Nakashima, Hajime Nagahara, Haruo Takemura (2020). Video analytics in blended learning: Insights from learner-video interaction patterns. Proc. Workshop on Addressing Drop-Out Rates in Higher Education (ADORE).

引用

Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima (2020). KnowIT VQA: Answering knowledge-based questions about videos. Proc. AAAI Conference Artificial Intelligence (AAAI).

引用 DOI

Takahiro Yamaguchi, Hajime Nagahara, Ken'ichi Morooka, Yuta Nakashima, Yuki Uranishi, Shoko Miyauchi, Ryo Kurazume (2020). 3D image reconstruction from multi-focus microscopic images. Proc. Pacific-Rim Symposium on Image and Video Technology (PSIVT).

引用 URL

2019

国際会議

Akihiko Sayo, Hayato Onizuka, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2019). Human shape reconstruction with loose clothes from partially observed data by pose specific deformation. Proc. Pacific-Rim Symposium on Image and Video Technology (PSIVT).

引用 DOI

Kazuki Ashihara, Chenhui Chu, Benjamin Renoust, Noriko Okubo, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2019). Legal information as a complex network: Improving topic modeling through homophily. Proc. International Conference on Complex Networks and Their Applications.

引用 URL

Mayu Otani, Chenhui Chu, Yuta Nakashima (2019). Adaptive gating mechanism for identifying visually grounded paraphrases. Proc. Multi-Discipline Approach for Learning Concepts.

引用

Benjamin Renoust, Matheus Oliveira Franca, Jacob Chan, Van Le, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Jueren Wang, Yutaka Fujioka (2019). BUDA.ART: A multimodal content-based analysis and retrieval system for Buddha statues. Proc. ACM International Conference on Multimedia (MM).

引用 DOI

Benjamin Renoust, Matheus Oliveira Franca, Jacob Chan, Noa Garcia, Van Le, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Jueren Wang, Yutaka Fujioka (2019). Historical and modern features for Buddha statue classification. Proc. Workshop on Structuring and Understanding of Multimedia HeritAge Contents.

引用 DOI

Manisha Verma, Hirokazu Kobori, Yuta Nakashima, Noriko Takemura, Hajime Nagahara (2019). Facial expression recognition with skip-connection to leverage low-level features. Proc. IEEE International Conference Image Processing (ICIP).

引用 DOI

Noa Garcia, Benjamin Renoust, Yuta Nakashima (2019). Context-aware embeddings for automatic art analysis. Proc. International Conference on Multimedia Retrieval (ICMR).

引用 DOI

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2019). Rethinking the evaluation of video summaries. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

引用 DOI

Shizuka Shirai, Noriko Takemura, Yuta Nakashima, Hajime Nagahara, Haruo Takemura (2019). Multimodal learning analytics: Society 5.0 project in Japan. Proc. International Conference on Learning Analytics and Knowledge (LAK).

引用

国内研究会など

Chenhui Chu, Koji Tanaka, Haolin Ren, Benjamin Renoust, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2019). Public Meeting Corpus Construction and Content Delivery. じんもんこん2019論文集.

引用

Benjamin Renoust, Matheus Oliveira Franca, Jacob Chan, Van Le, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Jueren Wang, Yutaka Fujioka (2019). Buddha statues archive retrieval system. 画像の認識・理解シンポジウム, 4 pages.

引用

Mayu Otani, Kazuhiro Ota, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Yoshitaka Ushiku (2019). Collecting relation-aware video captions. 画像の認識・理解シンポジウム, 4 pages.

引用

中島悠太, 馬場口登小林良輔 (2019). GANを用いた顔のRGB画像と奥行画像の同時生成. 情報処理学会情報科学技術フォーラム H-018.

引用

Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima (2019). Video meets knowledge in visual question answering. 画像の認識・理解シンポジウム, 4 pages.

引用

Zekun Yang, Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima, Haruo Takemura (2019). Video question answering with BERT. 画像の認識・理解シンポジウム, 4 pages.

引用

大谷まゆ, Chenhui Chu, 中島悠太, 竹村治雄萓谷勇太 (2019). コメディドラマにおける字幕と表情を用いた笑い予測. 2019年度人工知能学会全国大会 3Rin2-12, 1 page.

引用

Takaaki Yasui, Yuta Nakashima, Noboru Babaguchi (2019). Talking Head Generation with Deep Phoneme and Viseme Representation and Generative Adversarial Networks. 電子情報通信学会パターン認識・メディア理解 PRMU-2018-157.

引用

Benjamin Renoust, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Yutaka Fujioka (2019). Faces in an Archive of Buddhism Pictures. 情報処理学会人文科学とコンピュータ研究会 CH-119-7.

引用

長原一, 諸岡健一, 中島悠太, 浦西友樹, 倉爪亮, 大野英治山口貴大 (2019). 多重焦点顕微鏡画像列からの細胞の3次元形状復元. 情報処理学会コンピュータビジョンとイメージメディア CVIM-215-33.

引用

招待講演

Yuta Nakashima (2019). Using external knowledge in the deep learning framework. Physics Seminar, KEK.

引用

中島悠太 (2019). AI/機械学習/深層学習入門. 第16回日本加速器学会年会技術研修会.

引用

Yuta Nakashima (2019). Problems dealt with machine learning/deep learning and its applications to nuclear physics. Workshop on Interdisciplinary Approach of Applying Cutting-edge Technologies at the Frontier of Cancer Research.

引用

中島悠太 (2019). 情報学と物理学のクロスオーバー. 日本物理学会第74回年次大会.

引用

2018

論文誌

Mayu Otani, Atsushi Nishida, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2018). Finding important people in a video using deep neural networks with conditional random fields. IEICE Trans. Information Systems.

引用 DOI

Takahiro Tanaka, Norihiko Kawai, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2018). Iterative applications of image completion with CNN-based failure detection. Journal of Visual Communication and Image Representation.

引用 DOI

Antonio Tejero-De-Pablos, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya, Marko Linna, Esa Rahtu (2018). Summarization of user-generated sports video by using deep action recognition features. IEEE Trans. Multimedia.

引用 DOI

書籍

池田聖, 浦西友樹, 中島悠太, 森尚平, 山添大丈, 山本豪志朗 (訳) Michael Bayeler (著) (2018). OpenCVとPythonによる機械学習プログラミング. マイナビ, 352 pages.

引用

国際会議

Chenhui Chu, Mayu Otani, Yuta Nakashima (2018). iParaphrasing: Extracting visually grounded paraphrases via an image. Proc. International Conference on Computational Linguistics (COLING).

引用

Ryosuke Kimura, Akihiko Sayo, Fabian Lorenzo Dayrit, Yuta Nakashima, Hiroshi Kawasaki, Ambrosio Blanco, Katsushi Ikeuchi (2018). Representing a partially observed non-rigid 3D human using eigen-texture and eigen-deformation. Proc. International Conference on Pattern Recognition (ICPR).

引用 DOI

国内研究会など

Benjamin Renoust, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Yutaka Fujioka (2018). Exploration and Mining of 50,000 Buddha Pictures. 画像の認識・理解シンポジウム, 4 pages.

引用

Mayu Otani, Chenhui Chu, Yuta Nakashima (2018). Phrase localization-based visually grounded paraphrase identification. 画像の認識・理解シンポジウム, 4 pages.

引用

Akihiko Say, Ryosuke Kimura, Fabian Lorenzo Dayrit, Yuta Nakashima, Hiroshi Kawasaki, Ambrosio Blanco, Katsushi Ikeuchi (2018). Synthesis of human shape in loose cloth using eigen-deformation. 画像の認識・理解シンポジウム, 4 pages.

引用

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Naokazu Yokoya (2018). Linking videos and languages: Representations and their applications. 情報処理学会コンピュータビジョンとイメージメディア CVIM-212-38, 16 pages.

引用

Chenhui Chu, Mayu Otani, Yuta Nakashima (2018). Extracting Paraphrases Grounded by an Image. 情報処理学会コンピュータビジョンとイメージメディア CVIM-211-6.

引用

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2018). Finding Video Parts with Natural Language. 情報処理学会コンピュータビジョンとイメージメディア CVIM-211-7.

引用

2017

論文誌

Norihiko Kawai, Tomokazu Sato, Yuta Nakashima, Naokazu Yokoya (2017). Augmented reality marker hiding with texture deformation. IEEE Trans. Visualization and Computer Graphics.

引用 DOI

Mayu Otani, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2017). Video summarization using textual descriptions for authoring video blogs. Multimedia Tools and Applications.

引用 DOI

Fabian Lorenzo Dayrit, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2017). Increasing pose comprehension through augmented reality reenactment. Multimedia Tools and Applications.

引用 DOI

書籍

青砥隆仁, 井村誠孝, 大倉史生, 金谷一朗, 小枝正直, 中島悠太, 藤本雄一郎, 山口明彦, 山本豪志朗浦西友樹 (2017). 画像処理・機械学習プログラミングOpenCV 3対応. マイナビ, 176 pages.

引用

国際会議

Yuta Nakashima, Fumio Okura, Norihiko Kawai, Hiroshi Kawasaki, Ambrosio Blanco, Katsushi Ikeuchi (2017). Realtime novel view synthesis with eigen-texture regression. Proc. British Machine Vision Conference (BMVC).

引用

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2017). Video question answering to find a desired video segment. Proc. Open Knowledge Base and Question Answering Workshop (OKBQA).

引用

Thiwat Rongsirigul, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2017). Novel view synthesis with light-weight view-dependent texture mapping for a stereoscopic HMD. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用 DOI

Fabian Lorenzo Dayrit, Ryosuke Kimura, Yuta Nakashima, Ambrosio Blanco, Hiroshi Kawasaki, Katsushi Ikeuchi (2017). ReMagicMirror: Action learning using human reenactment with the mirror metaphor. Proc. International Conference on Multimedia Modeling (MMM).

引用 DOI

国内研究会など

大倉史生, 河合紀彦, 川崎洋, 池内克史中島悠太 (2017). 自由視点画像生成のためのEigen-Texture法における係数の回帰. 情報処理学会コンピュータビジョンとイメージメディア CVIM-209-39.

引用

大谷まゆ, 中島悠太, 佐藤智和, 横矢直和橋岡佳輝 (2017). DNNを用いたカメラの6自由度相対運動推定. 情報処理学会コンピュータビジョンとイメージメディア 2017-CVIM-206-13.

引用

招待講演

中島悠太 (2017). 最近の重要な論文の紹介 -- テキストとの対応付けによる映像の理解に関連して. ステアラボ人工知能シンポジウム2017.

引用

2016

論文誌

Antonio Tejero-De-Pablos, Yuta Nakashima, Naokazu Yokoya, Francisco-Javier Díaz-Pernas, Mario Mart\ńez-Zarzuela (2016). Flexible human action recognition in depth video sequences using masked joint trajectories. EURASIP Journal on Image and Video Processing.

引用 DOI

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2016). Privacy protection for social video via background estimation and CRF-based videographer's intention modeling. IEICE Trans. Information and Systems.

引用 DOI

Keita Katagiri, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). Novel View Synthesis Based on View-dependent Texture Mapping with Geometry-aware Color Continuity. Transactions of the Virtual Reality Society of Japan.

引用 DOI

Yuta Nakashima, Tomoaki Ikeno, Noboru Babaguchi (2016). Evaluating protection capability for visual privacy information. IEEE Security & Privacy.

引用 DOI

国際会議

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Naokazu Yokoya (2016). Video summarization using deep semantic features. Proc. Asian Conference on Computer Vision (ACCV).

引用 DOI

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Naokazu Yokoya (2016). Learning joint representations of videos and sentences with web image search. Proc. Workshop on Web-scale Vision and Social Media.

引用 DOI

Antonio Tejero-De-Pablos, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). Human action recognition-based video summarization for RGB-D personal sports video. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用 DOI

Hikari Takehara, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). 3D shape template generation from RGB-D images capturing a moving and deforming object. Proc. Electronic Imaging.

引用 DOI

国内研究会など

河合紀彦, 中島悠太, 佐藤智和, 横矢直和田中隆寛 (2016). 畳み込みニューラルネットワークを用いた修復失敗領域の自動検出による画像修復の反復的適用. 電子情報通信学会パターン認識・メディア理解 PRMU-2015-160.

引用

Thiwat Rongsirigul, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). Acceleration of View-dependent Texture Mapping-based Novel View Synthesis for stereoscopic HMD. 映像情報メディア学会2016年冬季大会.

引用

招待講演

中島悠太 (2016). 深層学習を利用した映像要約への取り組み. 第7回ステアラボ人工知能セミナー.

引用

Yuta Nakashima (2016). Joint representation of video and text using deep neural networks with help of web images. Microsoft Research Asia, Beijing.

引用

2015

論文誌

Yuta Nakashima, Yusuke Uno, Norihiko Kawai, Tomokazu Sato, Naokazu Yokoya (2015). AR image generation using view-dependent geometry modification and texture mapping. Virtual Reality.

引用 DOI

Noboru Babaguchi, Yuta Nakashima (2015). Protection and utilization of privacy information via sensing. IEICE Trans. Information and Systems.

引用 DOI

書籍

青砥隆仁, 浦西友樹, 大倉史生, 小枝正直, 中島悠太, 山本豪志朗藤本雄一郎 (2015). OpenCV 3 プログラミングブック. マイナビ, 280 pages.

引用

国際会議

Yuta Nakashima, Tatsuya Koyama, Naokazu Yokoya, Noboru Babaguchi (2015). Facial expression preserving privacy protection using image melding. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用 DOI

Mayu Otani, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2015). Textual description-based video summarization for video blogs. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用 DOI

国内研究会など

河合紀彦, 中島悠太, 佐藤智和, 横矢直和田中隆寛 (2015). 画像修復における畳み込みニューラルネットワークを用いた修復失敗領域の自動検出. 映像情報メディア学会 2015年冬季大会.

引用

中島悠太, 佐藤智和, 横矢直和武原光 (2015). 単一のRGB-Dカメラを用いた非剛体物体の3次元形状復元. 計測自動制御学会計測部門センシングフォーラム.

引用

中島悠太, 佐藤智和, 横矢直和片桐敬太 (2015). テクスチャの連続性を考慮した視点依存テクスチャマッピングによる自由視点画像生成. 電子情報通信学会パターン認識・メディア理解 PRMU-2014-162.

引用

中島悠太, 佐藤智和, 横矢直和黒川陽平 (2015). 特徴点の明示的な対応付けを伴わないカメラ位置姿勢推定. 情報処理学会コンピュータビジョンとイメージメディア CVIM-195-60.

引用

中島悠太, 佐藤智和, 河合紀彦, 横矢直和武原光 (2015). RGB-Dカメラを用いた非剛体物体の動き復元のためのRGB画像上の対応点に基づく3次元テンプレート生成. 情報処理学会コンピュータビジョンとイメージメディア CVIM-195-45.

引用

中島悠太, 佐藤智和, 横矢直和大谷まゆ (2015). テキストと映像の類似度を用いた映像要約. 電子情報通信学会パターン認識・メディア理解 PRMU-2014-95.

引用

中島悠太 (2015). 2035年のマルチメディアの姿を予想--ICME 2015 会議レポート. 情報処理.

引用

2014

論文誌

Norihiko Kawai, Naoya Inoue, Tomokazu Sato, Fumio Okura, Yuta Nakashima, Naokazu Yokoya (2014). Background estimation for a single omnidirectional image sequence captured with a moving camera. IPSJ Trans. Computer Vision and Applications.

引用 DOI

国際会議

Fabian Lorenzo Dayrit, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2014). Free-viewpoint AR human-motion reenactment based on a single RGB-D video stream. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用 DOI

国内研究会など

中島悠太, 佐藤智和, 河合紀彦, 横矢直和武原光 (2014). RGB-Dカメラを用いた非剛体物体の動き復元のための3次元テンプレート形状生成. 映像情報メディア学会 2014年冬季大会.

引用

中島悠太, 佐藤智和, 横矢直和黒川陽平 (2014). 特徴点の類似度尺度による対応付けを伴わないカメラ位置姿勢推定手法の検討. 映像情報メディア学会年次大会.

引用

中島悠太, 馬場口登小山達也 (2014). 画像のコンテキストを保持した視覚的に自然なプライバシー保護処理. 電子情報通信学会パターン認識・メディア理解 PRMU-2013-205.

引用

河合紀彦, 佐藤智和, 大倉史生, 中島悠太, 横矢直和井上直哉 (2014). 自由視点画像生成に基づく移動撮影した全方位動画像からの動物体除去. 電子情報通信学会総合大会 D-11-43, 1 page.

引用

Fabian Lorenzo Dayrit, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2014). Single RGB-D Video-stream Based Human-motion Reenactment. 映像情報メディア学会メディア工学 ME-2014-7.

引用

2013

国際会議

Yuta Nakashima, Yusuke Uno, Norihiko Kawai, Tomokazu Sato, Naokazu Yokoya (2013). Augmented reality image generation with virtualized real objects using view-dependent texture and geometry. Proc. IEEE International Symposium on Mixed and Augmented Reality (ISMAR).

引用 DOI

Yuta Nakashima, Naokazu Yokoya (2013). Inferring what the videographer wanted to capture. Proc. IEEE International Conference on Image Processing (ICIP).

引用 DOI

Tatsuya Koyama, Yuta Nakashima, Noboru Babaguchi (2013). Real-time privacy protection system for social videos using intentionally-captured persons detection. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用

国内研究会など

中島悠太, 河合紀彦, 佐藤智和, 横矢直和宇野祐介 (2013). 拡張現実感のための視点依存テクスチャ・ジオメトリに基づく仮想化実物体の輪郭形状の修復. 情報処理学会コンピュータビジョンとイメージメディア CVIM-185-35.

引用

2012

論文誌

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2012). Intended human object detection for automatically protecting privacy in mobile video surveillance. Multimedia Systems.

引用 DOI

国際会議

Tatsuya Koyama, Yuta Nakashima, Noboru Babaguchi (2012). Markov random field-based real-time detection of intentionally-captured persons. Proc. IEEE International Conference on Image Processing (ICIP).

引用 DOI

国内研究会など

池野知顕, 馬場口登中島悠太 (2012). 顔画像に対するプライバシー保護処理の有効性の定量的評価. 情報処理学会セキュリティ心理学とトラスト SPT-4-9.

引用

2011

論文誌

Yuta Nakashima, Ryosuke Kaneto, Noboru Babaguchi (2011). Indoor positioning system using digital audio watermarking. IEICE Trans. Information and Systems.

引用 DOI

国際会議

Yuta Nakashima, Noboru Babaguchi (2011). Extracting intentionally captured regions using point trajectories. Proc. ACM International Conference on Multimedia (MM).

引用 DOI

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2011). Automatic generation of privacy-protected videos using background estimation. Proc. IEEE International Conference on Multimedia and Expo (ICME).

引用 DOI

国内研究会など

中島悠太, 馬場口登上柿普史 (2011). カメラの動きと映像特徴からの撮影者が意図した領域の推定. 画像の認識・理解シンポジウム.

引用

2010

国際会議

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2010). Automatically protecting privacy in consumer generated videos using intended human object detector. Proc. ACM International Conference on Multimedia (MM).

引用 DOI

Hiroshi Uegaki, Yuta Nakashima, Noboru Babaguchi (2010). Discriminating intended human objects in consumer videos. Proc. International Conference on Pattern Recognition (ICPR).

引用 DOI

Ryosuke Kaneto, Yuta Nakashima, Noboru Babaguchi (2010). Real-time user position estimation in indoor environments using digital watermarking for audio signals. Proc. International Conference on Pattern Recognition (ICPR).

引用 DOI

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2010). Detecting intended human objects in human-captured videos. Proc. IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

引用 DOI

Takumi Takehara, Yuta Nakashima, Naoko Nitta, Noboru Babaguchi (2010). Digital diorama: Sensing-based real-world visualization. Proc. International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems.

引用 DOI

国内研究会など

上柿普史, 馬場口登中島悠太 (2010). 映像中の撮影者が意図した人物被写体の検出. 電子情報通信学会 2010年総合大会 D-12-41.

引用

中島悠太, 馬場口登兼頭亮介 (2010). 音響電子透かしを用いた屋内での録音位置推定. 電子情報通信学会 2010年総合大会 DS-3-1.

引用

2009

論文誌

Yuta Nakashima, Ryuki Tachibana, Noboru Babaguchi (2009). Watermarked movie soundtrack finds the position of the camcorder in a theater. IEEE Trans. Multimedia.

引用 DOI

国内研究会など

中島悠太, 馬場口登上柿普史 (2009). 映像特徴に基づく撮影者が意図した人物被写体の推定. 情報処理学会情報科学技術フォーラム K-046.

引用

中島悠太, 馬場口登兼頭亮介 (2009). 音響電子透かしの検出強度を用いた位置推定. 電子情報通信学会 2009年総合大会 DS-3-10.

引用

2007

国際会議

Yuta Nakashima, Ryuki Tachibana, Noboru Babaguchi (2007). Maximum-likelihood estimation of recording position based on audio watermarking. Proc. International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIHMSP).

引用 DOI

Yuta Nakashima, Ryuki Tachibana, Masafumi Nishimura, Noboru Babaguchi (2007). Determining Recording Location Based on Synchronization Positions of Audio watermarking. Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).

引用 DOI

2006

国際会議

Yuta Nakashima, Ryuki Tachibana, Masafumi Nishimura, Noboru Babaguchi (2006). Estimation of recording location using audio watermarking. Proc. Workshop on Multimedia and Security (MM&Sec).

引用 DOI