Conference proceedings – Page 3

AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models

The 2024 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2024.
Wu, Xiyang, Tianrui Guan, Dianqi Li, Shuaiyi Huang, Xiaoyu Liu, Xijun Wang, Ruiqi Xian, Abhinav Shrivastava, Furong Huang, Jordan Lee Boyd-Graber, Tianyi Zhou, and Dinesh Manocha.

Publisher's website

AutoDAN: Interpretable Gradient-Based Adversarial Attacks on Large Language Models

First Conference on Language Modeling (COLM), 2024.
Zhu, Sicheng, Ruiyi Zhang, Bang An, Gang Wu, Joe Barrow, Zichao Wang, Furong Huang, Ani Nenkova, and Tong Sun.

Automatic Pseudo-Harmful Prompt Generation for Evaluating False Refusals in Large Language Models

First Conference on Language Modeling (COLM), 2024.
Zhu, Sicheng, Bang An, Ruiyi Zhang, Michael-Andrei Panaitescu-Liess, Yuancheng Xu, and Furong Huang.

Mementos: A Comprehensive Benchmark for Multimodal Large Language Model Reasoning over Image Sequences

The 62nd Annual Meeting of the Association for Computational Linguistics (ACL), 2024.
Wang, Xiyao, Yuhang Zhou, Xiaoyu Liu, Hongjin Lu, Yuancheng Xu, Feihong He, Jaehong Yoon, Taixi Lu, Fuxiao Liu, Gedas Bertasius, Mohit Bansal, Huaxiu Yao, and Furong Huang.

Explore Spurious Correlations at the Concept Level in Language Models for Text Classification

The 62nd Annual Meeting of the Association for Computational Linguistics (ACL), 2024.
Zhou, Yuhang, Paiheng Xu, Xiaoyu Liu, Bang An, Wei Ai, and Furong Huang.

Premier-TACO is a Few-Shot Policy Learner: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss

Proceedings of the 41st International Conference on Machine Learning (ICML), 2024.
Zheng, Ruijie, Yongyuan Liang, Xiyao Wang, Shuang Ma, Hal Daum ́e III, Huazhe Xu, John Langford, Praveen Palanisamy, Kalyan Shankar Basu, Furong Huang.

Furong Huang

Associate Professor @ University of Maryland

Publication Type: Conference proceedings

AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models

AutoDAN: Interpretable Gradient-Based Adversarial Attacks on Large Language Models

Automatic Pseudo-Harmful Prompt Generation for Evaluating False Refusals in Large Language Models

Mementos: A Comprehensive Benchmark for Multimodal Large Language Model Reasoning over Image Sequences

Explore Spurious Correlations at the Concept Level in Language Models for Text Classification

Premier-TACO is a Few-Shot Policy Learner: Pretraining Multitask Representation via Temporal Action-Driven Contrastive Loss

WAVES: Benchmarking the Robustness of Image Watermarks

Position Paper: On the Possibilities of AI-Generated Text Detection

Adapting Static Fairness to Sequential Decision-Making: Bias Mitigation Strategies towards Equal Long-term Benefit Rate

PRISE: LLM-Style Sequence Compression for Learning Temporal Action Abstractions in Control

Where Has Furong Been? Behind the Scenes of Our NeurIPS Competition

Past News

NeurIPS ’22 Main Conference Papers from Huang Lab @UMD