Publications

2026

Article

Xinpeng Liu, Hiroaki Santo, Yosuke Toda, Fumio Okura (2026). PlantPose: Universal plant skeleton estimation via tree-constrained graph generation. International Journal of Computer Vision.

Cite DOI

Lilika Makabe, Kohei Ashida, Hiroaki Santo, Fumio Okura, Yasuyuki Matsushita (2026). DP-SfM: Dual-pixel structure-from-motion without scale ambiguity. IEEE Transactions on Pattern Analysis and Machine Intelligence.

Cite DOI

Ryota Fujii, Akichika Nakashima, Hiroaki Santo, Toshiyasu Kinari, Fumio Okura (2026). Empirical hyperelastic modeling of textile fabrics for measuring nonlinear bending rigidity. Engineering with Computers.

Cite DOI

Weng Ian Chan, Hiroaki Santo, Yasuyuki Matsushita, Fumio Okura (2026). Instance-wise distribution control of text-to-image diffusion models. Pattern Recognition.

Cite DOI

Tongyu Yang, Heng Guo, Yasuyuki Matsushita, Fumio Okura, Yu Luo, Xin Fan (2026). High-fidelity multi-view normal integration with scale-encoded neural surface representations. Computer Graphics Forum.

Cite DOI

Yang Yang, Ren Nakagawa, Risa Shinoda, Hiroaki Santo, Kenji Oyama, Takenao Ohkawa, Fumio Okura (2026). Talking with Actionbits---A part-enhanced VLM for action and interaction recognition in animals. Sensors.

Cite DOI

Conference

Zaiyan Yang, Xinpeng Liu, Heng Guo, Jinglei Shi, Zhanyu Ma, Fumio Okura (2026). NRGS: Neural regularization for robust 3D semantic Gaussian splatting. Proc. the IEEE International Conference on Multimedia and Expo (ICME2026).

Cite

Risa Shinoda, Kaede Shiohara, Nakamasa Inoue, Kuniaki Saito, Hiroaki Santo, Fumio Okura (2026). BioVITA: Biological dataset, model, and benchmark for visual-textual-acoustic alignment. Proc. the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2026).

Cite

Risa Shinoda, Kaede Shiohara, Nakamasa Inoue, Hiroaki Santo, Fumio Okura (2026). AnimalCLAP: Taxonomy-aware language-audio pretraining for species recognition and trait inference. Proc. the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2026).

Cite

Xinpeng Liu, Fumio Okura (2026). Gaussian mesh renderer for lightweight differentiable rendering. Proc. the IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP2026).

Cite

Ryohei Goto, Takuya Fujihashi, Shunsuke Saruwatari, Fumio Okura (2026). Unsupervised 3D human pose estimation via conditional multi-view ancestral sampling. Proc. the IEEE International Conference on Automatic Face and Gesture Recognition (FG2026).

Cite

Ren Nakagawa, Yang Yang, Risa Shinoda, Hiroaki Santo, Kenji Oyama, Fumio Okura, Takenao Ohkawa (2026). Interaction-via-Actions: Cattle interaction detection with joint learning of action-interaction latent space. Proc. the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV2026).

Cite

Liyun Zhang, Zheng Lian, Hong Liu, Takanori Takebe, Shozo Nishii, Yuta Nakashima (2026). QuMAB: Query-based Multi-annotator Behavior Pattern Learning. Proc. the AAAI Conference on Artificial Intelligence (AAAI2026).

Cite DOI

Liyun Zhang, Zheng Lian, Hong Liu, Takanori Takebe, Yuta Nakashima (2026). SimLabel: Similarity-Weighted Semi-supervision for Multi-annotator Learning with Missing Labels. Proc. the AAAI Conference on Artificial Intelligence (AAAI2026).

Cite DOI

Junhao Xing, Ryohei Miyakawa, Yang Yang, Xinpeng Liu, Risa Shinoda, Hiroaki Santo, Yosuke Toda, Fumio Okura (2026). Zero-shot hierarchical plant segmentation via foundation segmentation models and text-to-image attention. Proc. the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV2026).

Cite

2025

Article

Jiahao Zhang, Shoya Wada, Kento Sugimoto, Takayuki Niitsu, Kiyoharu Fukushima, Hiroshi Kida, Bowen Wang, Shozo Konishi, Katsuki Okada, Yuta Nakashima, Toshihiro Takeda (2025). ILD-Slider: A Parameter-Efficient Model for Identifying Progressive Fibrosing Interstitial Lung Disease from Chest CT Slices. Journal of Imaging.

Cite DOI URL

Naoki Asada, Xinpeng Liu, Kanyu Xu, Ryohei Miyakawa, Yang Yang, Hiroaki Santo, Yosuke Toda, Fumio Okura (2025). LeafGen: Structure-aware leaf image generation for annotation-free leaf instance segmentation. Plant Phenomics.

Cite DOI

Jiahao Zhang, Bowen Wang, Hong Liu, Liangzhi Li, Yuta Nakashima, Hajime Nagahara (2025). E-InMeMo: Enhanced Prompting for Visual In-Context Learning. Journal of Imaging.

Cite DOI URL

Xinpeng Liu, Kanyu Xu, Risa Shinoda, Hiroaki Santo, Fumio Okura (2025). Masks-to-Skeleton: Multi-view mask-based tree skeleton extraction with 3D Gaussian splatting. Sensors.

Cite DOI

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2025). Mitigating Gender Bias in Captioning Systems. IEICE Transactions on Information and Systems.

Cite DOI URL

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2025). Societal Bias in Image Captioning: Identifying and Measuring Bias Amplification. IEICE Transactions on Information and Systems.

Cite DOI URL

Hugo Lemarchant, Hong Liu, Yuta Nakashima (2025). RobustQuote: Using Reference Images for Adversarial Robustness. Applied Sciences.

Cite DOI URL

Yiming Qian, Cheikh Brahim El Vaigh, Yuta Nakashima, Benjamin Renoust, Hajime Nagahara, Yutaka Fujioka (2025). Built year prediction of Buddha face with heterogeneous label modeled as probabilistic distribution. Multimedia Tools and Applications.

Cite DOI URL

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2025). PixCon: Pixel-Level Contrastive Learning Revisited. Electronics.

Cite DOI URL

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2025). Text-Guided Diverse Scene Interaction Synthesis by Disentangling Actions from Scenes. IEEE Access.

Cite DOI URL

Cheikh Brahim El Vaigh, Noa Garcia, Benjamin Renoust, Chenhui Chu, Yuta Nakashima, Yiming Qian, Hajime Nagahara (2025). GNNBoost: boosting artwork classification with graph embeddings. Multimedia Tools and Applications.

Cite DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia (2025). Revealing Gender Bias from Prompt to Image in Stable Diffusion. Journal of Imaging.

Cite DOI URL

Conference

Shunsuke Ichimiya, Yuta Nakashima (2025). A Needle in a Haystack: Finding Contextual Knowledge for Video Question Answering. Proc. the Asian Conference on Pattern Recognition (ACPR2025).

Cite DOI

Yusuke Hirota, Ryo Hachiuma, Boyi Li, Ximing Lu, Michael Ross Boone, Boris Ivanovic, Yejin Choi, Marco Pavone, Yu-Chiang Frank Wang, Noa Garcia, Yuta Nakashima, Chao-Han Huck Yang (2025). Bias in Gender Bias Benchmarks: How Spurious Features Distort Evaluation. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

Cite

Ryan Ramos, Yusuke Hirota, Yuta Nakashima, Noa Garcia (2025). From Global to Local: Social Bias Transfer in CLIP. Proc. the IEEE/CVF International Conference on Computer Vision Workshops (ICCVW2025).

Cite

Yang Yang, Dongni Mao, Hiroaki Santo, Yasuyuki Matsushita, Fumio Okura (2025). NeuraLeaf: Neural parametric leaf models with shape and deformation disentanglement. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

Cite

Rawisara Lohanimit, Yankun Wu, Amelia Katirai, Yuta Nakashima, Noa Garcia (2025). Privacy in Image Datasets: A Case Study on Pregnancy Ultrasounds. Proc. the AAAI/ACM Conference on AI, Ethics, and Society (AIES-25).

Cite DOI

Ryan Ramos, Vladan Stojnić, Giorgos Kordopatis-Zilos, Yuta Nakashima, Giorgos Tolias, Noa Garcia (2025). Processing and acquisition traces in visual encoders: What does CLIP know about your camera?. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

Cite

Lilika Makabe, Hiroaki Santo, Fumio Okura, Michael S. Brown, Yasuyuki Matsushita (2025). Spectral sensitivity estimation with an uncalibrated diffraction grating. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

Cite

Bowen Wang, Zhouqiang Jiang, Yasuaki Susumu, Shotaro Miwa, Tianwei Chen, Yuta Nakashima (2025). Taming the Untamed: Graph-Based Knowledge Retrieval and Reasoning for MLLMs to Conquer the Unknown. Proc. the IEEE/CVF International Conference on Computer Vision (ICCV2025).

Cite

Jovana Panic, Atsushi Watanabe, Hideaki Hayashi, Yuta Nakashima, Kohji Nishida, Hajime Nagahara (2025). Impact of Experimental Design in Age Prediction from Retinal Fundus Images. Proc. the 47th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC2025).

Cite DOI

Yusuke Hirota, Boyi Li, Ryo Hachiuma, Yueh-Hua Wu, Boris Ivanovic, Marco Pavone, Yejin Choi, Yu-Chiang Frank Wang, Yuta Nakashima, Chao-Han Huck Yang (2025). LOTUS: A Leaderboard for Detailed Image Captioning from Quality to Societal Bias and User Preferences. Proc. the 63rd Annual Meeting of the Association for Computational Linguistics (ACL2025).

Cite DOI

Xinpeng Liu, Zeyi Huang, Fumio Okura, Yasuyuki Matsushita (2025). HoGS: Unified near and far object reconstruction via homogeneous gaussian splatting. Proc. the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR2025).

Cite DOI

Risa Kondo, Ayu Teramen, Reon Kajikawa, Koki Horiguchi, Tomoyuki Kajiwara, Takashi Ninomiya, Hideaki Hayashi, Yuta Nakashima, Hajime Nagahara (2025). Text Normalization for Japanese Sentiment Analysis. Proc. the Tenth Workshop on Noisy and User-generated Text (W-NUT 2025).

Cite DOI

Junhao Chen, Bowen Wang, Zhouqiang Jiang, Yuta Nakashima (2025). Putting People in LLMs’ Shoes: Generating Better Answers via Question Rewriter. Proc. the AAAI Conference on Artificial Intelligence.

Cite DOI

Patrick Ramos, Nicolas Gonthier, Selina Khan, Yuta Nakashima, Noa Garcia (2025). No Annotations for Object Detection in Art through Stable Diffusion. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

Cite DOI

Hong Liu, Yuta Nakashima, Noboru Babaguchi (2025). PALADIN: Understanding Video Intentions in Political Advertisement Videos. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

Cite DOI

Zhouqiang Jiang, Bowen Wang, Junhao Chen, Yuta Nakashima (2025). Relayout: Towards real-world document understanding via layout-enhanced pre-training. Proc. the 31st International Conference on Computational Linguistics (Coling2025).

Cite

2024

Article

Ziyu Guan, Wanqing Zhao, Hongmin Liu, Yuta Nakashima, Noboru Babaguchi, Xiaofei He (2024). Cross-modal Guided Visual Representation Learning for Social Image Retrieval. IEEE Transactions on Pattern Analysis and Machine Intelligence.

Cite DOI URL

Tianwei Chen, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima, Hajime Nagahara (2024). Learning More May Not Be Better: Knowledge Transferability in Vision-and-Language Tasks. Journal of Imaging.

Cite DOI URL

Yusuke Hirota, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima (2024). A picture may be worth a hundred words for visual question answering. Electronics.

Cite DOI URL

Yiming Qian, Liangzhi Li, Yuta Nakashima, Hajime Nagahara, Kohji Nishida, Ryo Kawasaki (2024). Is cardiovascular risk profiling from UK Biobank retinal images using explicit deep learning estimates of traditional risk factors equivalent to actual risk measurements? A prospective cohort study design. BMJ Open.

Cite DOI URL

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2024). Unleashing the Power of Contrastive Learning for Zero-Shot Video Summarization. Journal of Imaging.

Cite DOI URL

Amelia Katirai, Noa Garcia, Kazuki Ide, Yuta Nakashima, Atsuo Kishimoto (2024). Situating the social issues of image generation models in the model life cycle: a sociotechnical approach. AI and Ethics.

Cite DOI URL

Amelia Katirai Noa Garcia Kazuki Ide Yuta Nakashima, Atsuo Kishimoto (2024). Situating the social issues of image generation models in the model life cycle: a sociotechnical approach. AI and Ethics.

Cite DOI URL

Tianwei Chen, Noa Garcia, Liangzhi Li, Yuta Nakashima (2024). Exploring Emotional Stimuli Detection in Artworks: A Benchmark Dataset and Baselines Evaluation. Journal of Imaging.

Cite DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia (2024). GOYA: Leveraging Generative Art for Content-Style Disentanglement. Journal of Imaging.

Cite DOI URL

Bowen Wang, Jiaxin Zhang, Ran Zhang, Yunqin Li, Liangzhi Li, Yuta Nakashima (2024). Improving facade parsing with vision transformers and line integration. Advanced Engineering Informatics.

Cite DOI URL

Conference

Bowen Wang, Jiuyang Chang, Yiming Qian, Guoxin Chen, Junhao Chen, Zhouqiang Jiang, Jiahao Zhang, Yuta Nakashima, Hajime Nagahara (2024). DiReCT: Diagnostic Reasoning for Clinical Notes via Large Language Models. Proc. Thirty-Eighth Annual Conference on Neural Information Processing Systems (NeurIPS).

Cite

Yusuke Hirota, Ryo Hachiuma, Chao-Han Huck Yang, Yuta Nakashima (2024). From Descriptive Richness to Bias: Unveiling the Dark Side of Generative Image Caption Enrichment. Proc. 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP).

Cite

Yusuke Hirota, Jerone TA Andrew, Dora Zhao, Orestis Papakyriakopoulos, Apostolos Modas, Yuta Nakashima, Alice Xiang (2024). Resampled Datasets Are Not Enough: Mitigating Societal Bias Beyond Single Attributes. Proc. 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP).

Cite

Liyun Zhang, Zhaojie Luo Amd Shuqiong Wu, Yuta Nakashima (2024). MicroEmo: Time-Sensitive Multimodal Emotion Recognition with Subtle Clue Dynamics in Video Dialogues. Proc. 2nd International Workshop on Multimodal and Responsible Affective Computing.

Cite DOI

Yankun Wu, Yuta Nakashima, Noa Garcia (2024). Stable Diffusion Exposed: Gender Bias from Prompt to Image. Proc. AAAI/ACM Conference on AI, Ethics, and Society.

Cite

Warren Leu, Yuta Nakashima, Noa Garcia (2024). Auditing Image-based NSFW Classifiers for Content Filtering. Proc. ACM Conference on Fairness, Accountability, and Transparency (FAccT).

Cite DOI URL

Tianwei Chen, Yusuke Hirota, Mayu Otani, Noa Garcia, Yuta Nakashima (2024). Would Deep Generative Models Amplify Bias in Future Models?. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia, Sheng Li, Zhaoyang Zeng (2024). Reproducibility Companion Paper: Stable Diffusion for Content-Style Disentanglement in Art Analysis. Proc. 2024 International Conference on Multimedia Retrieval (ICMR).

Cite DOI URL

Tianwei Chen, Noa Garcia, Liangzhi Li, Yuta Nakashima (2024). Retrieving Emotional Stimuli in Artworks. Proc. 2024 International Conference on Multimedia Retrieval (ICMR).

Cite DOI URL

Jiahao Zhang, Bowen Wang, Liangzhi Li, Yuta Nakashima, Hajime Nagahara (2024). Instruct me more! Random prompting for visual in-context learning. Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV).

Cite DOI URL

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2024). Revisiting pixel-level contrastive pre-training on scene images. Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV).

Cite DOI URL

2023

Article

Yuta Nakashima, Yusuke Hirota, Yankun Wu, Noa Garcia (2023). Societal Bias in Vision-and-Language Datasets and Models. Journal of the Imaging Society of Japan.

Cite DOI URL

Yasutaka Okita, Toru Hirano, Bowen Wang, Yuta Nakashima, Saki Minoda, Hajime Nagahara, Atsushi Kumanogoh (2023). Automatic evaluation of atlantoaxial subluxation in rheumatoid arthritis by a deep learning model. Arthritis Research & Therapy.

Cite DOI URL

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2023). ACT2G: Attention-based Contrastive Learning for Text-to-Gesture Generation. Proceedings of the ACM on Computer Graphics and Interactive Techniques.

Cite DOI URL

Zekun Yang, Yuta Nakashima, Haruo Takemura (2023). Multi-modal humor segment prediction in video. Multimedia Systems.

Cite DOI URL

Bowen Wang, Liangzhi Li, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2023). Real-time estimation of the remaining surgery duration for cataract surgery using deep convolutional neural networks and long short-term memory. BMC Medical Informatics and Decision Making.

Cite DOI URL

Kiichi Goto, Taikan Suehara, Tamaki Yoshioka, Masakazu Kurata, Hajime Nagahara, Yuta Nakashima, Noriko Takemura, Masako Iwasaki (2023). Development of a vertex finding algorithm using recurrent neural network. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment.

Cite DOI URL

Conference

Wanqing Zhao, Yuta Nakashima, Haiyuan Chen, Noboru Babaguchi (2023). Enhancing Fake News Detection in Social Media via Label Propagation on Cross-Modal Tweet Graph. Proc. ACM International Conference on Multimedia (MM).

Cite DOI URL

Bowen Wang, Liangzhi Li, Yuta Nakashima, Hajime Nagahara (2023). Learning bottleneck concepts in image classification. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI URL

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2023). Model-agnostic gender debiased image captioning. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI URL

Yankun Wu, Yuta Nakashima, Noa Garcia (2023). Not only generative art: Stable diffusion for content-style disentanglement in art analysis. Proc. 2023 ACM International Conference on Multimedia Retrieval (ICMR).

Cite DOI URL

Mayu Otani, Riku Togashi, Yu Sawai, Ryosuke Ishigami, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Shin’ichi Satoh (2023). Toward verifiable and reproducible human evaluation for text-to-image generation. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI URL

Noa Garcia, Yusuke Hirota, Yankun Wu, Yuta Nakashima (2023). Uncurated image-text datasets: Shedding light on demographic bias. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI URL

Hugo Lemarchant, Liangzi Li, Yiming Qian, Yuta Nakashima, Hajime Nagahara (2023). Inference Time Evidences of Adversarial Attacks for Forensic on Transformers. Proc. AAAI-23 Workshop on Artificial Intelligence for Cyber Security (AICS).

Cite

Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara (2023). Contrastive Losses Are Natural Criteria for Unsupervised Video Summarization. Proc. IEEE/CVF Winter Conference on Applications of Computer Vision (WACV).

Cite DOI URL

2022

Article

Koji Tanaka, Chenhui Chu, Tomoyuki Kajiwara, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2022). Corpus Construction for Historical Newspapers: A Case Study on Public Meeting Corpus Construction Using OCR Error Correction. SN Computer Science.

Cite DOI URL

Sudhakar Kumawat, Manisha Verma, Yuta Nakashima, Shanmuganathan Raman (2022). Depthwise spatio-temporal STFT convolutional neural networks for human action recognition. IEEE Trans. Pattern Analysis and Machine Intelligence.

Cite DOI URL

Bowen Wang, Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2022). Match them up: Visually explainable few-shot image classification. Applied Intelligence.

Cite DOI

Felix Giovanni Virgo, Chenhui Chu, Takaya Ogawa, Koji Tanaka, Kazuki Ashihara, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2022). Information Extraction from Public Meeting Articles. SN Computer Science.

Cite DOI

Zhenzhong Kuang, Longbin Teng, Xingchi He, Jiajun Ding, Yuta Nakashima, Noboru Babaguchi (2022). Anonymous identity sampling and reusable synthesis for sensitive face camouflage. Journal of Electronic Imaging.

Cite DOI

Conference

Haruya Suzuki, Sora Tarumoto, Tomoyuki Kajiwara, Takashi Ninomiya, Yuta Nakashima, Hajime Nagahara (2022). Emotional Intensity Estimation based on Writer’s Personality. Proc. 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing (AACL-IJCNJP): Student Research Workshop.

Cite

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2022). Deep Gesture Generation for Social Robots Using Type-Specific Libraries. Proc. 2022 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS).

Cite DOI URL

Manisha Verma, Yuta Nakashima, Noriko Takemura, Hajime Nagahara (2022). Multi-label disengagement and behavior prediction in online learning. Proc. International Conference on Artificial Intelligence in Education.

Cite DOI URL

Haruya Suzuki, Yuto Miyauchi, Kazuki Akiyama, Tomoyuki Kajiwara, Takashi Ninomiya, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2022). A Japanese Dataset for Subjective and Objective Sentiment Polarity Classification in Micro Blog Domain. Proc. Thirteenth Language Resources and Evaluation Conference (LREC).

Cite

Riku Togashi, Mayu Otani, Yuta Nakashima, Janne Heikkilä Esa Rahtu, Tetsuya Sakai (2022). AxIoU: An Axiomatically Justified Measure for Video Moment Retrieval. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2022). Gender and racial bias in visual question answering datasets. Proc. ACM Conference on Fairness, Accountability, and Transparency (FAccT).

Cite DOI

Mayu Otani, Riku Togashi, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Shin'ichi Satoh (2022). Optimal Correction Cost for Object Detection Evaluation. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI

Yusuke Hirota, Yuta Nakashima, Noa Garcia (2022). Quantifying Societal Bias Amplification in Image Captioning. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI

Anh-Khoa Vo, Yuta Nakashima (2022). Tone Classification for Political Advertising Video using Multimodal Cues. Proc. 3rd ACM Workshop on Intelligent Cross-Data Analysis and Retrieval.

Cite DOI URL

Hitoshi Teshima, Naoki Wake, Diego Thomas, Yuta Nakashima, David Baumert, Hiroshi Kawasaki, Katsushi Ikeuchi (2022). Integration of gesture generation system using gesture library with DIY robot design kit. Proc. IEEE/SICE International Symposium on System Integration (SII).

Cite DOI

2021

Article

Chenhui Chu, Vinicius Oliveira, Felix Giovanni Virgo, Mayu Otani, Noa Garcia, Yuta Nakashima (2021). The semantic typology of visually grounded paraphrases. Computer Vision and Image Understanding.

Cite DOI

Zekun Yang, Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima, Haruo Takemura (2021). A comparative study of language Transformers for video question answering. Neurocomputing.

Cite DOI URL

Bowen Wang, Liangzhi Li, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara, Yasushi Yagi (2021). Noisy-LSTM: Improving temporal awareness for video semantic segmentation. IEEE Access.

Cite DOI URL

Noboru Babaguchi, Isao Echizen, Junichi Yamagishi, Naoko Nitta, Yuta Nakashima, Kazuaki Nakamura, Kazuhiro Kono, Fuming Fang, Seiko Myojin, Zhenzhong Kuang, Huy H.~Nguyen, Ngoc-Dung T.~Tieu (2021). Generation and detection of media clones. IEICE Trans. Information and Systems.

Cite DOI

Noboru Babaguchi, Isao Echizen, Junichi Yamagishi, Naoko Nitta, Yuta Nakashima, Kazuaki Nakamura, Kazuhiro Kono, Fuming Fang, Seiko Myojin, Zhenzhong Kuang, Huy H.~Nguyen, Ngoc-Dung T.~Tieu (2021). Preventing fake information generation against media clone attacks. IEICE Trans. Information and Systems.

Cite DOI

Conference

Zechen Bai, Yuta Nakashima, Noa Garcia (2021). Explain me the painting: Multi-topic knowledgeable art description generation. Proc. IEEE/CVF International Conference on Computer Vision (ICCV).

Cite DOI

Cheikh Brahim El Vaigh, Noa Garcia, Benjamin Renoust, Chenhui Chu, Yuta Nakashima, Hajime Nagahara (2021). GCNBoost: Artwork Classification by Label Propagation Through a Knowledge Graph. Proc. ACM International Conference on Multimedia Retrieval (ICMR).

Cite DOI

Bowen Wang, Liangzhi Li, Yuta Nakashima, Takehiro Yamamoto, Hiroaki Ohshima, Yoshiyuki Shoji, Kenro Aihara, Noriko Kando (2021). Image Retrieval by Hierarchy-aware Deep Hashing Based on Multi-task Learning. Proc. ACM International Conference on Multimedia Retrieval (ICMR).

Cite DOI

Liangzhi Li, Bowen Wang, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2021). SCOUTER: Slot attention-based classifier for explainable image recognition. Proc. IEEE/CVF International Conference on Computer Vision (ICCV).

Cite DOI

Tianran Wu, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima, Haruo Takemura (2021). Transferring domain-agnostic knowledge in video question answering. Proc. British Machine Vision Conference (BMVC).

Cite

Yiming Qian, Cheikh Brahim El Vaigh, Yuta Nakashima, Benjamin Renoust, Hajime Nagahara, Yutaka Fujioka (2021). Built year prediction from Buddha face with heterogeneous labels. Proc. Workshop on Structuring and Understanding of Multimedia Heritage Contents (SUMAC).

Cite

Yusuke Hirota, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima, Ittetsu Taniguchi, Takao Onoye (2021). Visual question answering with textual representations for images. Proc. IEEE/CVF International Conference on Computer Vision Workshops (ICCVW).

Cite DOI

Manisha Verma, Yuta Nakashima, Hirokazu Kobori, Ryota Takaoka, Noriko Takemura, Tsukasa Kimura, Hajime Nagahara, Masayuki Numao, Kazumitsu Shinohara (2021). Learners' efficiency prediction using facial behavior analysis. Proc. International Conference on Image Processing (ICIP).

Cite DOI

Yoshiyuki Shoji, Kenro Aihara, Noriko Kando, Yuta Nakashima, Hiroaki Ohshima, Shio Takidaira, Masaki Ueta, Takehiro Yamamoto, Yusuke Yamamoto (2021). Museum Experience into a Souvenir: Generating Memorable Postcards from Guide Device Behavior Log. Proc. ACM/IEEE Joint Conference on Digital Libraries (JCDL).

Cite DOI

Akihiko Sayo, Diego Thomas, Hiroshi Kawasaki, Yuta Nakashima, Katsushi Ikeuchi (2021). PoseRN: A 2D pose refinement network for bias-free multi-view 3D human pose estimation. Proc. International Conference on Image Processing (ICIP).

Cite DOI

Jules Samaran, Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima (2021). Attending self-attention: A case study of visually grounded supervision in vision-and-language transformers. Proc. Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: Student Research Workshop.

Cite DOI

Bowen Wang, Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2021). MTUNet: Few-shot image classification with visual explanations. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

Cite DOI

Tomoyuki Kajiwara, Chenhui Chu, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2021). WRIME: A new dataset for emotional intensity estimation with subjective and objective annotations. Proc. Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT).

Cite DOI

Yuta Kayatani, Zekun Yang, Mayu Otani, Noa Garcia, Chenhui Chu, Yuta Nakashima, Haruo Takemura (2021). The laughing machine: Predicting humor in video. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

Cite DOI

2020

Article

Noa Garcia, Benjamin Renoust, Yuta Nakashima (2020). ContextNet: Representation and exploration for painting classification and retrieval in context. International Journal on Multimedia Information Retrieval.

Cite DOI

Wenjian Dong, Mayu Otani, Noa Garcia, Yuta Nakashima, Chenhui Chu (2020). Cross-lingual visual grounding. IEEE Access.

Cite DOI

Kazuki Ashihara, Cheikh Brahim El Vaigh, Chenhui Chu, Benjamin Renoust, Noriko Okubo, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2020). Improving topic modeling through homophily for legal documents. Applied Network Science.

Cite DOI

Mayu Otani, Chenhui Chu, Yuta Nakashima (2020). Visually grounded paraphrase identification via gating and phrase localization. Neurocomputing.

Cite DOI

Tsukasa Kimura, Noriko Takemura, Yuta Nakashima, Hirokazu Kobori, Hajime Nagahara, Masayuki Numao, Kazumitsu Shinohara (2020). Warmer environments increase implicit mental workload even if learning efficiency is enhanced. Frontiers in Psychology.

Cite DOI

Yuta Nakashima, Takaaki Yasui, Leon Nguyen, Noboru Babaguchi (2020). Speech-driven face reenactment for a video sequence. ITE Trans. Media Technology and Applications.

Cite DOI

Conference

Sora Ohashi, Tomoyuki Kajiwara, Chenhui Chu, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2020). IDSOU at WNUT-2020 Task 2: Identification of informative COVID-19 English tweets. Proc. Workshop on Noisy User-Generated Text (W-NUT).

Cite URL

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2020). Uncovering hidden challenges in query-based video moment retrieval. Proc. British Machine Vision Conference (BMVC).

Cite

Noa Garcia, Chentao Ye, Zihua Liu, Qingtao Hu, Mayu Otani, Chenhui Chu, Yuta Nakashima, Teruko Mitamura (2020). A dataset and baselines for visual question answering on art. Proc. European Conference on Computer Vision Workshops (VISARTS).

Cite DOI

Nikolai Huckle, Noa Garcia, Yuta Nakashima (2020). Demographic Influences on Contemporary Art with Unsupervised Style Embeddings. Proc. European Conference on Computer Vision Workshops (VISARTS).

Cite DOI

Noa Garcia, Yuta Nakashima (2020). Knowledge-based video question answering with unsupervised scene descriptions. Proc. European Conference on Computer Vision (ECCV).

Cite DOI

Zhiqiang Guo, Huigui Liu, Zhenzhong Kuang, Yuta Nakashima, Noboru Babaguchi (2020). Privacy sensitive large-margin model for face de-identification. Proc. International Conference on Neural Computing for Advanced Applications (NCAA).

Cite URL

Liangzhi Li, Manisha Verma, Yuta Nakashima, Ryo Kawasaki, Hajime Nagahara (2020). Joint learning of vessel segmentation and artery/vein classification with post-processing. Proc. Medical Imaging with Deep Learning (MIDL).

Cite

Noa Garcia, Mayu Otani, Chenhui Chu, Yuta Nakashima (2020). Knowledge-Based Visual Question Answering in Videos. Proc. Workshop on Women in Computer Vision.

Cite

Manisha Verma, Sudhakar Kumawat, Yuta Nakashima, Shanmuganathan Raman (2020). Yoga-82: A new dataset for fine-grained classification of human poses. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

Cite DOI URL

Koji Tanaka, Chenhui Chu, Haolin Ren, Benjamin Renoust, Yuta Nakashima, Noriko Takemura, Hajime Nagahara, Takao Fujikawa (2020). Constructing a public meeting corpus. Proc. Conference on Language Resources and Evaluation (LREC).

Cite

Zekun Yang, Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima, Haruo Takemura (2020). BERT representations for video question answering. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

Cite DOI

Liangzhi Li, Manisha Verma, Yuta Nakashima, Hajime Nagahara, Ryo Kawasaki (2020). IterNet: Retinal image segmentation utilizing structural redundancy in vessel networks. Proc. IEEE Winter Conference on Applications of Computer Vision (WACV).

Cite DOI

Yuta Nakashima, Hirokazu Kobori, Ryota Takaoka, Noriko Takemura, Tsukasa Kimura, Hajime Nagahara, Masayuki Numao, Kazumitsu Shinohara (2020). Toward predicting learners' efficiency for adaptive e-learning. Proc. International Learning Analytics and Knowledge Conference (LAK).

Cite

Mehrasa Alizadeh, Shizuka Shirai, Noriko Takemura, Shogo Terai, Yuta Nakashima, Hajime Nagahara, Haruo Takemura (2020). Video analytics in blended learning: Insights from learner-video interaction patterns. Proc. Workshop on Addressing Drop-Out Rates in Higher Education (ADORE).

Cite

Noa Garcia, Chenhui Chu, Mayu Otani, Yuta Nakashima (2020). KnowIT VQA: Answering knowledge-based questions about videos. Proc. AAAI Conference Artificial Intelligence (AAAI).

Cite DOI

Takahiro Yamaguchi, Hajime Nagahara, Ken'ichi Morooka, Yuta Nakashima, Yuki Uranishi, Shoko Miyauchi, Ryo Kurazume (2020). 3D image reconstruction from multi-focus microscopic images. Proc. Pacific-Rim Symposium on Image and Video Technology (PSIVT).

Cite URL

2019

Conference

Akihiko Sayo, Hayato Onizuka, Diego Thomas, Yuta Nakashima, Hiroshi Kawasaki, Katsushi Ikeuchi (2019). Human shape reconstruction with loose clothes from partially observed data by pose specific deformation. Proc. Pacific-Rim Symposium on Image and Video Technology (PSIVT).

Cite DOI

Kazuki Ashihara, Chenhui Chu, Benjamin Renoust, Noriko Okubo, Noriko Takemura, Yuta Nakashima, Hajime Nagahara (2019). Legal information as a complex network: Improving topic modeling through homophily. Proc. International Conference on Complex Networks and Their Applications.

Cite URL

Mayu Otani, Chenhui Chu, Yuta Nakashima (2019). Adaptive gating mechanism for identifying visually grounded paraphrases. Proc. Multi-Discipline Approach for Learning Concepts.

Cite

Benjamin Renoust, Matheus Oliveira Franca, Jacob Chan, Van Le, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Jueren Wang, Yutaka Fujioka (2019). BUDA.ART: A multimodal content-based analysis and retrieval system for Buddha statues. Proc. ACM International Conference on Multimedia (MM).

Cite DOI

Benjamin Renoust, Matheus Oliveira Franca, Jacob Chan, Noa Garcia, Van Le, Ayaka Uesaka, Yuta Nakashima, Hajime Nagahara, Jueren Wang, Yutaka Fujioka (2019). Historical and modern features for Buddha statue classification. Proc. Workshop on Structuring and Understanding of Multimedia HeritAge Contents.

Cite DOI

Manisha Verma, Hirokazu Kobori, Yuta Nakashima, Noriko Takemura, Hajime Nagahara (2019). Facial expression recognition with skip-connection to leverage low-level features. Proc. IEEE International Conference Image Processing (ICIP).

Cite DOI

Noa Garcia, Benjamin Renoust, Yuta Nakashima (2019). Context-aware embeddings for automatic art analysis. Proc. International Conference on Multimedia Retrieval (ICMR).

Cite DOI

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2019). Rethinking the evaluation of video summaries. Proc. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).

Cite DOI

Shizuka Shirai, Noriko Takemura, Yuta Nakashima, Hajime Nagahara, Haruo Takemura (2019). Multimodal learning analytics: Society 5.0 project in Japan. Proc. International Conference on Learning Analytics and Knowledge (LAK).

Cite

2018

Article

Mayu Otani, Atsushi Nishida, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2018). Finding important people in a video using deep neural networks with conditional random fields. IEICE Trans. Information Systems.

Cite DOI

Takahiro Tanaka, Norihiko Kawai, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2018). Iterative applications of image completion with CNN-based failure detection. Journal of Visual Communication and Image Representation.

Cite DOI

Antonio Tejero-De-Pablos, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya, Marko Linna, Esa Rahtu (2018). Summarization of user-generated sports video by using deep action recognition features. IEEE Trans. Multimedia.

Cite DOI

Conference

Chenhui Chu, Mayu Otani, Yuta Nakashima (2018). iParaphrasing: Extracting visually grounded paraphrases via an image. Proc. International Conference on Computational Linguistics (COLING).

Cite

Ryosuke Kimura, Akihiko Sayo, Fabian Lorenzo Dayrit, Yuta Nakashima, Hiroshi Kawasaki, Ambrosio Blanco, Katsushi Ikeuchi (2018). Representing a partially observed non-rigid 3D human using eigen-texture and eigen-deformation. Proc. International Conference on Pattern Recognition (ICPR).

Cite DOI

2017

Article

Norihiko Kawai, Tomokazu Sato, Yuta Nakashima, Naokazu Yokoya (2017). Augmented reality marker hiding with texture deformation. IEEE Trans. Visualization and Computer Graphics.

Cite DOI

Mayu Otani, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2017). Video summarization using textual descriptions for authoring video blogs. Multimedia Tools and Applications.

Cite DOI

Fabian Lorenzo Dayrit, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2017). Increasing pose comprehension through augmented reality reenactment. Multimedia Tools and Applications.

Cite DOI

Conference

Yuta Nakashima, Fumio Okura, Norihiko Kawai, Hiroshi Kawasaki, Ambrosio Blanco, Katsushi Ikeuchi (2017). Realtime novel view synthesis with eigen-texture regression. Proc. British Machine Vision Conference (BMVC).

Cite

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä (2017). Video question answering to find a desired video segment. Proc. Open Knowledge Base and Question Answering Workshop (OKBQA).

Cite

Thiwat Rongsirigul, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2017). Novel view synthesis with light-weight view-dependent texture mapping for a stereoscopic HMD. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite DOI

Fabian Lorenzo Dayrit, Ryosuke Kimura, Yuta Nakashima, Ambrosio Blanco, Hiroshi Kawasaki, Katsushi Ikeuchi (2017). ReMagicMirror: Action learning using human reenactment with the mirror metaphor. Proc. International Conference on Multimedia Modeling (MMM).

Cite DOI

2016

Article

Antonio Tejero-De-Pablos, Yuta Nakashima, Naokazu Yokoya, Francisco-Javier Díaz-Pernas, Mario Mart\ńez-Zarzuela (2016). Flexible human action recognition in depth video sequences using masked joint trajectories. EURASIP Journal on Image and Video Processing.

Cite DOI

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2016). Privacy protection for social video via background estimation and CRF-based videographer's intention modeling. IEICE Trans. Information and Systems.

Cite DOI

Keita Katagiri, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). Novel View Synthesis Based on View-dependent Texture Mapping with Geometry-aware Color Continuity. Transactions of the Virtual Reality Society of Japan.

Cite DOI

Yuta Nakashima, Tomoaki Ikeno, Noboru Babaguchi (2016). Evaluating protection capability for visual privacy information. IEEE Security & Privacy.

Cite DOI

Conference

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Naokazu Yokoya (2016). Video summarization using deep semantic features. Proc. Asian Conference on Computer Vision (ACCV).

Cite DOI

Mayu Otani, Yuta Nakashima, Esa Rahtu, Janne Heikkilä, Naokazu Yokoya (2016). Learning joint representations of videos and sentences with web image search. Proc. Workshop on Web-scale Vision and Social Media.

Cite DOI

Antonio Tejero-De-Pablos, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). Human action recognition-based video summarization for RGB-D personal sports video. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite DOI

Hikari Takehara, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2016). 3D shape template generation from RGB-D images capturing a moving and deforming object. Proc. Electronic Imaging.

Cite DOI

2015

Article

Yuta Nakashima, Yusuke Uno, Norihiko Kawai, Tomokazu Sato, Naokazu Yokoya (2015). AR image generation using view-dependent geometry modification and texture mapping. Virtual Reality.

Cite DOI

Noboru Babaguchi, Yuta Nakashima (2015). Protection and utilization of privacy information via sensing. IEICE Trans. Information and Systems.

Cite DOI

Conference

Yuta Nakashima, Tatsuya Koyama, Naokazu Yokoya, Noboru Babaguchi (2015). Facial expression preserving privacy protection using image melding. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite DOI

Mayu Otani, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2015). Textual description-based video summarization for video blogs. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite DOI

2014

Article

Norihiko Kawai, Naoya Inoue, Tomokazu Sato, Fumio Okura, Yuta Nakashima, Naokazu Yokoya (2014). Background estimation for a single omnidirectional image sequence captured with a moving camera. IPSJ Trans. Computer Vision and Applications.

Cite DOI

Conference

Fabian Lorenzo Dayrit, Yuta Nakashima, Tomokazu Sato, Naokazu Yokoya (2014). Free-viewpoint AR human-motion reenactment based on a single RGB-D video stream. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite DOI

2013

Conference

Yuta Nakashima, Yusuke Uno, Norihiko Kawai, Tomokazu Sato, Naokazu Yokoya (2013). Augmented reality image generation with virtualized real objects using view-dependent texture and geometry. Proc. IEEE International Symposium on Mixed and Augmented Reality (ISMAR).

Cite DOI

Yuta Nakashima, Naokazu Yokoya (2013). Inferring what the videographer wanted to capture. Proc. IEEE International Conference on Image Processing (ICIP).

Cite DOI

Tatsuya Koyama, Yuta Nakashima, Noboru Babaguchi (2013). Real-time privacy protection system for social videos using intentionally-captured persons detection. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite

2012

Article

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2012). Intended human object detection for automatically protecting privacy in mobile video surveillance. Multimedia Systems.

Cite DOI

Conference

Tatsuya Koyama, Yuta Nakashima, Noboru Babaguchi (2012). Markov random field-based real-time detection of intentionally-captured persons. Proc. IEEE International Conference on Image Processing (ICIP).

Cite DOI

2011

Article

Yuta Nakashima, Ryosuke Kaneto, Noboru Babaguchi (2011). Indoor positioning system using digital audio watermarking. IEICE Trans. Information and Systems.

Cite DOI

Conference

Yuta Nakashima, Noboru Babaguchi (2011). Extracting intentionally captured regions using point trajectories. Proc. ACM International Conference on Multimedia (MM).

Cite DOI

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2011). Automatic generation of privacy-protected videos using background estimation. Proc. IEEE International Conference on Multimedia and Expo (ICME).

Cite DOI

2010

Conference

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2010). Automatically protecting privacy in consumer generated videos using intended human object detector. Proc. ACM International Conference on Multimedia (MM).

Cite DOI

Hiroshi Uegaki, Yuta Nakashima, Noboru Babaguchi (2010). Discriminating intended human objects in consumer videos. Proc. International Conference on Pattern Recognition (ICPR).

Cite DOI

Ryosuke Kaneto, Yuta Nakashima, Noboru Babaguchi (2010). Real-time user position estimation in indoor environments using digital watermarking for audio signals. Proc. International Conference on Pattern Recognition (ICPR).

Cite DOI

Yuta Nakashima, Noboru Babaguchi, Jianping Fan (2010). Detecting intended human objects in human-captured videos. Proc. IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).

Cite DOI

Takumi Takehara, Yuta Nakashima, Naoko Nitta, Noboru Babaguchi (2010). Digital diorama: Sensing-based real-world visualization. Proc. International Conference on Information Processing and Management of Uncertainty in Knowledge-Based Systems.

Cite DOI

2009

Article

Yuta Nakashima, Ryuki Tachibana, Noboru Babaguchi (2009). Watermarked movie soundtrack finds the position of the camcorder in a theater. IEEE Trans. Multimedia.

Cite DOI

2007

Conference

Yuta Nakashima, Ryuki Tachibana, Noboru Babaguchi (2007). Maximum-likelihood estimation of recording position based on audio watermarking. Proc. International Conference on Intelligent Information Hiding and Multimedia Signal Processing (IIHMSP).

Cite DOI

Yuta Nakashima, Ryuki Tachibana, Masafumi Nishimura, Noboru Babaguchi (2007). Determining Recording Location Based on Synchronization Positions of Audio watermarking. Proc. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).

Cite DOI

2006

Conference

Yuta Nakashima, Ryuki Tachibana, Masafumi Nishimura, Noboru Babaguchi (2006). Estimation of recording location using audio watermarking. Proc. Workshop on Multimedia and Security (MM&Sec).

Cite DOI