Author: "Michael Backes" / Journal: corr - Searchworks@Jio Institute Digital Library Search Results

1. Inside the Black Box: Detecting Data Leakage in Pre-trained Language Encoders.

Author: Yuan Xin, Zheng Li 0023, Ning Yu, Dingfan Chen, Mario Fritz, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

2. Vera Verto: Multimodal Hijacking Attack.

Author: Minxing Zhang, Ahmed Salem 0001, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

3. Image-Perfect Imperfections: Safety, Bias, and Authenticity in the Shadow of Text-To-Image Model Evolution.

Author: Yixin Wu, Yun Shen, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

4. ICLGuard: Controlling In-Context Learning Behavior for Applicability Authorization.

Author: Wai Man Si, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

5. Breaking Agents: Compromising Autonomous LLM Agents Through Malfunction Amplification.

Author: Boyang Zhang, Yicong Tan, Yun Shen, Ahmed Salem 0001, Michael Backes 0001, Savvas Zannettou, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

6. SOS! Soft Prompt Attack Against Open-Source Large Language Models.

Author: Ziqing Yang 0002, Michael Backes 0001, Yang Zhang 0016, and Ahmed Salem 0001
Published: 2024
Full Text: View/download PDF

7. TrustLLM: Trustworthiness in Large Language Models.

Author: Lichao Sun 0001, Yue Huang, Haoran Wang, Siyuan Wu, Qihui Zhang, Chujie Gao, Yixin Huang, Wenhan Lyu, Yixuan Zhang, Xiner Li, Zhengliang Liu, Yixin Liu 0002, Yijue Wang, Zhikun Zhang 0001, Bhavya Kailkhura, Caiming Xiong, Chaowei Xiao, Chunyuan Li, Eric P. Xing, Furong Huang, Hao Liu, Heng Ji, Hongyi Wang 0001, Huan Zhang 0001, Huaxiu Yao, Manolis Kellis, Marinka Zitnik, Meng Jiang 0001, Mohit Bansal, James Zou 0001, Jian Pei, Jian Liu, Jianfeng Gao 0001, Jiawei Han 0001, Jieyu Zhao, Jiliang Tang, Jindong Wang 0001, John C. Mitchell, Kai Shu, Kaidi Xu, Kai-Wei Chang, Lifang He 0001, Lifu Huang, Michael Backes 0001, Neil Zhenqiang Gong, Philip S. Yu, Pin-Yu Chen, Quanquan Gu, Ran Xu, Rex Ying, Shuiwang Ji, Suman Jana, Tianlong Chen, Tianming Liu 0001, Tianyi Zhou 0001, William Wang 0001, Xiang Li 0001, Xiangliang Zhang 0001, Xiao Wang, Xing Xie 0001, Xun Chen, Xuyu Wang, Yan Liu 0002, Yanfang Ye 0001, Yinzhi Cao, and Yue Zhao 0016
Published: 2024
Full Text: View/download PDF

8. Link Stealing Attacks Against Inductive Graph Neural Networks.

Author: Yixin Wu, Xinlei He 0001, Pascal Berrang, Mathias Humbert, Michael Backes 0001, Neil Zhenqiang Gong, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

9. Memorization in Self-Supervised Learning Improves Downstream Generalization.

Author: Wenhao Wang, Muhammad Ahmad Kaleem, Adam Dziedzic, Michael Backes 0001, Nicolas Papernot, and Franziska Boenisch
Published: 2024
Full Text: View/download PDF

10. Conversation Reconstruction Attack Against GPT Models.

Author: Junjie Chu, Zeyang Sha, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

11. Rapid Adoption, Hidden Risks: The Dual Impact of Large Language Model Customization.

Author: Rui Zhang, Hongwei Li 0001, Rui Wen 0002, Wenbo Jiang, Yuan Zhang 0006, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

12. Do You Even Lift? Strengthening Compiler Security Guarantees Against Spectre Attacks.

Author: Xaver Fabian, Marco Patrignani, Marco Guarnieri, and Michael Backes 0001
Published: 2024
Full Text: View/download PDF

13. Comprehensive Assessment of Jailbreak Attacks Against LLMs.

Author: Junjie Chu, Yugeng Liu, Ziqing Yang 0002, Xinyue Shen, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

14. Voice Jailbreak Attacks Against GPT-4o.

Author: Xinyue Shen, Yixin Wu, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

15. UnsafeBench: Benchmarking Image Safety Classifiers on Real-World and AI-Generated Images.

Author: Yiting Qu, Xinyue Shen, Yixin Wu, Michael Backes 0001, Savvas Zannettou, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

16. Efficient Data-Free Model Stealing with Label Diversity.

Author: Yiyong Liu, Rui Wen 0002, Michael Backes 0001, and Yang Zhang 0016
Published: 2024
Full Text: View/download PDF

17. FAKEPCD: Fake Point Cloud Detection via Source Attribution.

Author: Yiting Qu, Zhikun Zhang 0001, Yun Shen, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

18. You Are How You Walk: Quantifying Privacy Risks in Step Count Data.

Author: Bartlomiej Surma, Tahleen A. Rahman, Monique M. B. Breteler, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

19. Robustness Over Time: Understanding Adversarial Examples' Effectiveness on Longitudinal Versions of Large Language Models.

Author: Yugeng Liu, Tianshuo Cong, Zhengyu Zhao 0001, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

20. Composite Backdoor Attacks Against Large Language Models.

Author: Hai Huang, Zhengyu Zhao 0001, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

21. Generative Watermarking Against Unauthorized Subject-Driven Image Synthesis.

Author: Yihan Ma, Zhengyu Zhao 0001, Xinlei He 0001, Zheng Li 0023, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

22. Generated Graph Detection.

Author: Yihan Ma, Zhikun Zhang 0001, Ning Yu, Xinlei He 0001, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

23. Watermarking Diffusion Model.

Author: Yugeng Liu, Zheng Li 0023, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

24. Secure Composition of Robust and Optimising Compilers.

Author: Matthis Kruse, Michael Backes 0001, and Marco Patrignani
Published: 2023
Full Text: View/download PDF

25. MGTBench: Benchmarking Machine-Generated Text Detection.

Author: Xinlei He 0001, Xinyue Shen, Zeyuan Chen, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

26. In ChatGPT We Trust? Measuring and Characterizing the Reliability of ChatGPT.

Author: Xinyue Shen, Zeyuan Chen, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

27. Prompt Stealing Attacks Against Text-to-Image Generation Models.

Author: Xinyue Shen, Yiting Qu, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

28. FACE-AUDITOR: Data Auditing in Facial Recognition Systems.

Author: Min Chen 0032, Zhikun Zhang 0001, Tianhao Wang 0001, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

29. Two-in-One: A Model Hijacking Attack Against Text Generation Models.

Author: Wai Man Si, Michael Backes 0001, Yang Zhang 0016, and Ahmed Salem 0001
Published: 2023
Full Text: View/download PDF

30. Generating Less Certain Adversarial Examples Improves Robust Generalization.

Author: Minxing Zhang, Michael Backes 0001, and Xiao Zhang
Published: 2023
Full Text: View/download PDF

31. Mondrian: Prompt Abstraction Attack Against Large Language Models for Cheaper API Pricing.

Author: Wai Man Si, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

32. Vision-language models boost food composition compilation.

Author: Peihua Ma, Yixin Wu, Ning Yu, Yang Zhang 0016, Michael Backes 0001, Qin Wang, and Cheng-I Wei
Published: 2023
Full Text: View/download PDF

33. On the Proactive Generation of Unsafe Images From Text-To-Image Models Using Benign Prompts.

Author: Yixin Wu, Ning Yu, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

34. Comprehensive Assessment of Toxicity in ChatGPT.

Author: Boyang Zhang, Xinyue Shen, Wai Man Si, Zeyang Sha, Zeyuan Chen, Ahmed Salem 0001, Yun Shen, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

35. Provably Robust Cost-Sensitive Learning via Randomized Smoothing.

Author: Yuan Xin, Michael Backes 0001, and Xiao Zhang
Published: 2023
Full Text: View/download PDF

36. Generated Distributions Are All You Need for Membership Inference Attacks Against Generative Models.

Author: Minxing Zhang, Ning Yu, Rui Wen 0002, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

37. Transferable Availability Poisoning Attacks.

Author: Yiyong Liu, Michael Backes 0001, and Xiao Zhang
Published: 2023
Full Text: View/download PDF

38. Revisiting Transferable Adversarial Image Examples: Attack Categorization, Evaluation Guidelines, and New Insights.

Author: Zhengyu Zhao 0001, Hanwei Zhang, Renjue Li, Ronan Sicre, Laurent Amsaleg, Michael Backes 0001, Qi Li 0002, and Chao Shen 0001
Published: 2023
Full Text: View/download PDF

39. Backdoor Attacks Against Dataset Distillation.

Author: Yugeng Liu, Zheng Li 0023, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

40. Quantifying Privacy Risks of Prompts in Visual Prompt Learning.

Author: Yixin Wu, Rui Wen 0002, Michael Backes 0001, Pascal Berrang, Mathias Humbert, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

41. SecurityNet: Assessing Machine Learning Vulnerabilities on Public Models.

Author: Boyang Zhang, Zheng Li 0023, Ziqing Yang 0002, Xinlei He 0001, Michael Backes 0001, Mario Fritz, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

42. Unsafe Diffusion: On the Generation of Unsafe Images and Hateful Memes From Text-To-Image Models.

Author: Yiting Qu, Xinyue Shen, Xinlei He 0001, Michael Backes 0001, Savvas Zannettou, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

43. Last One Standing: A Comparative Analysis of Security and Privacy of Soft Prompt Tuning, LoRA, and In-Context Learning.

Author: Rui Wen 0002, Tianhao Wang 0001, Michael Backes 0001, Yang Zhang 0016, and Ahmed Salem 0001
Published: 2023
Full Text: View/download PDF

44. Prompt Backdoors in Visual Prompt Learning.

Author: Hai Huang, Zhengyu Zhao 0001, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

45. From Visual Prompt Learning to Zero-Shot Transfer: Mapping Is All You Need.

Author: Ziqing Yang 0002, Zeyang Sha, Michael Backes 0001, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

46. 'Do Anything Now': Characterizing and Evaluating In-The-Wild Jailbreak Prompts on Large Language Models.

Author: Xinyue Shen, Zeyuan Chen, Michael Backes 0001, Yun Shen, and Yang Zhang 0016
Published: 2023
Full Text: View/download PDF

47. Why So Toxic? Measuring and Triggering Toxic Behavior in Open-Domain Chatbots.

Author: Wai Man Si, Michael Backes 0001, Jeremy Blackburn, Emiliano De Cristofaro, Gianluca Stringhini, Savvas Zannettou, and Yang Zhang 0016
Published: 2022
Full Text: View/download PDF

48. Data Poisoning Attacks Against Multimodal Encoders.

Author: Ziqing Yang 0002, Xinlei He 0001, Zheng Li 0023, Michael Backes 0001, Mathias Humbert, Pascal Berrang, and Yang Zhang 0016
Published: 2022
Full Text: View/download PDF

49. A Systematic Study of the Consistency of Two-Factor Authentication User Journeys on Top-Ranked Websites (Extended Version).

Author: Sanam Ghorbani Lyastani, Michael Backes 0001, and Sven Bugiel
Published: 2022
Full Text: View/download PDF

50. On Xing Tian and the Perseverance of Anti-China Sentiment Online.

Author: Xinyue Shen, Xinlei He 0001, Michael Backes 0001, Jeremy Blackburn, Savvas Zannettou, and Yang Zhang 0016
Published: 2022
Full Text: View/download PDF

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Publication Year Range

Publication Type

Database

117 results on '"Michael Backes"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources