Author: "Ion Stoica" - Searchworks@Jio Institute Digital Library Search Results

Your search keyword '"Ion Stoica"' showing total 781 results

Start Over Author "Ion Stoica"

781 results on '"Ion Stoica"'

1. MoE-Lightning: High-Throughput MoE Inference on Memory-constrained GPUs.

Author: Shiyi Cao, Shu Liu, Tyler Griggs, Peter Schafhalter, Xiaoxuan Liu, Ying Sheng 0007, Joseph E. Gonzalez, Matei Zaharia, and Ion Stoica
Published: 2025
Full Text: View/download PDF

2. Locality-aware Fair Scheduling in LLM Serving.

Author: Shiyi Cao, Yichuan Wang, Ziming Mao, Pin-Lun Hsu, Liangsheng Yin, Tian Xia, Dacheng Li, Shu Liu, Yineng Zhang, Yang Zhou, Ying Sheng 0007, Joseph Gonzalez 0001, and Ion Stoica
Published: 2025
Full Text: View/download PDF

3. Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards.

Author: Yangsibo Huang, Milad Nasr, Anastasios Angelopoulos, Nicholas Carlini, Wei-Lin Chiang, Christopher A. Choquette-Choo, Daphne Ippolito, Matthew Jagielski, Katherine Lee, Ken Ziyu Liu, Ion Stoica, Florian Tramèr, and Chiyuan Zhang
Published: 2025
Full Text: View/download PDF

4. The Streaming Batch Model for Efficient and Fault-Tolerant Heterogeneous Execution.

Author: Frank Sifei Luan, Ziming Mao, Ron Yifeng Wang, Charlotte Lin, Amog Kamsetty, Hao Chen, Cheng Su, Balaji Veeramani, Scott Lee, SangBin Cho, Clark Zinzow, Eric Liang, Ion Stoica, and Stephanie Wang
Published: 2025
Full Text: View/download PDF

5. FogROS2-FT: Fault Tolerant Cloud Robotics.

Author: Kaiyuan Chen, Kush Hari, Trinity Chung, Michael Wang, Nan Tian, Christian Juette, Jeffrey Ichnowski, Liu Ren, John Kubiatowicz, Ion Stoica, and Ken Goldberg
Published: 2024
Full Text: View/download PDF

6. Revisiting Cache Freshness for Emerging Real-Time Applications.

Author: Ziming Mao, Rishabh R. Iyer, Scott Shenker, and Ion Stoica
Published: 2024
Full Text: View/download PDF

7. Fairness in Serving Large Language Models.

Author: Ying Sheng 0007, Shiyi Cao, Dacheng Li, Banghua Zhu, Zhuohan Li 0001, Danyang Zhuo, Joseph E. Gonzalez, and Ion Stoica
Published: 2024

8. ZKML: An Optimizing System for ML Inference in Zero-Knowledge Proofs.

Author: Bing-Jyue Chen, Suppakit Waiwitlikhit, Ion Stoica, and Daniel Kang
Published: 2024
Full Text: View/download PDF

9. Starburst: A Cost-aware Scheduler for Hybrid Cloud.

Author: Michael Luo, Siyuan Zhuang, Suryaprakash Vengadesan, Romil Bhardwaj, Justin Chang, Eric J. Friedman, Scott Shenker, and Ion Stoica
Published: 2024

10. Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks.

Author: Daniel Kang, Xuechen Li, Ion Stoica, Carlos Guestrin, Matei Zaharia, and Tatsunori Hashimoto
Published: 2024
Full Text: View/download PDF

11. Can't Be Late: Optimizing Spot Instance Savings under Deadlines.

Author: Zhanghao Wu, Wei-Lin Chiang, Ziming Mao, Zongheng Yang, Eric J. Friedman, Scott Shenker, and Ion Stoica
Published: 2024

12. Cloudcast: High-Throughput, Cost-Aware Overlay Multicast in the Cloud.

Author: Sarah Wooders, Shu Liu, Paras Jain 0001, Xiangxi Mo, Joseph E. Gonzalez, Vincent Liu 0001, and Ion Stoica
Published: 2024

13. Towards Optimal Transaction Scheduling.

Author: Audrey Cheng, Aaron N. Kabcenell, Jason Chan, Xiao Shi, Peter D. Bailis, Natacha Crooks, and Ion Stoica
Published: 2024
Full Text: View/download PDF

14. Composing MPC With LQR and Neural Network for Amortized Efficiency and Stable Control.

Author: Fangyu Wu 0003, Guanhua Wang, Siyuan Zhuang, Kehan Wang, Alexander Keimer, Ion Stoica, and Alexandre M. Bayen
Published: 2024
Full Text: View/download PDF

15. Are More LLM Calls All You Need? Towards the Scaling Properties of Compound AI Systems.

Author: Lingjiao Chen, Jared Quincy Davis, Boris Hanin, Peter Bailis, Ion Stoica, Matei A. Zaharia, and James Y. Zou
Published: 2024

16. Crafting Interpretable Embeddings for Language Neuroscience by Asking LLMs Questions.

Author: Vinamra Benara, Chandan Singh, John X. Morris, Richard Antonello, Ion Stoica, Alexander Huth, and Jianfeng Gao 0001
Published: 2024

17. SGLang: Efficient Execution of Structured Language Model Programs.

Author: Lianmin Zheng, Liangsheng Yin, Zhiqiang Xie, Chuyue Sun, Jeff Huang 0001, Cody Hao Yu, Shiyi Cao, Christos Kozyrakis, Ion Stoica, Joseph E. Gonzalez, Clark W. Barrett, and Ying Sheng 0007
Published: 2024

18. Efficient LLM Scheduling by Learning to Rank.

Author: Yichao Fu, Siqi Zhu, Runlong Su, Aurick Qiao, Ion Stoica, and Hao Zhang 0025
Published: 2024

19. Stylus: Automatic Adapter Selection for Diffusion Models.

Author: Michael Luo, Justin Wong, Brandon Trabucco, Yanping Huang, Joseph E. Gonzalez, Zhifeng Chen, Ruslan Salakhutdinov, and Ion Stoica
Published: 2024

20. R2E: Turning any Github Repository into a Programming Agent Environment.

Author: Naman Jain, Manish Shetty, Tianjun Zhang, King Han, Koushik Sen, and Ion Stoica
Published: 2024

21. MuxServe: Flexible Spatial-Temporal Multiplexing for Multiple LLM Serving.

Author: Jiangfei Duan, Runyu Lu, Haojie Duanmu, Xiuhong Li, Xingcheng Zhang, Dahua Lin, Ion Stoica, and Hao Zhang 0025
Published: 2024

22. Break the Sequential Dependency of LLM Inference Using Lookahead Decoding.

Author: Yichao Fu, Peter Bailis, Ion Stoica, and Hao Zhang 0025
Published: 2024

23. Online Speculative Decoding.

Author: Xiaoxuan Liu, Lanxiang Hu, Peter Bailis, Alvin Cheung, Zhijie Deng, Ion Stoica, and Hao Zhang 0025
Published: 2024

24. Trustless Audits without Revealing Data or Models.

Author: Suppakit Waiwitlikhit, Ion Stoica, Yi Sun 0010, Tatsunori Hashimoto, and Daniel Kang
Published: 2024

25. Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference.

Author: Wei-Lin Chiang, Lianmin Zheng, Ying Sheng 0007, Anastasios Nikolas Angelopoulos, Tianle Li, Dacheng Li, Banghua Zhu, Hao Zhang 0025, Michael I. Jordan, Joseph E. Gonzalez, and Ion Stoica
Published: 2024

26. LLM-Assisted Code Cleaning For Training Accurate Code Generators.

Author: Naman Jain, Tianjun Zhang, Wei-Lin Chiang, Joseph E. Gonzalez, Koushik Sen, and Ion Stoica
Published: 2024

27. LMSYS-Chat-1M: A Large-Scale Real-World LLM Conversation Dataset.

Author: Lianmin Zheng, Wei-Lin Chiang, Ying Sheng 0007, Tianle Li, Siyuan Zhuang, Zhanghao Wu, Yonghao Zhuang 0001, Zhuohan Li 0001, Zi Lin, Eric P. Xing, Joseph E. Gonzalez, Ion Stoica, and Hao Zhang 0025
Published: 2024

28. SLoRA: Scalable Serving of Thousands of LoRA Adapters.

Author: Ying Sheng 0007, Shiyi Cao, Dacheng Li, Coleman Hooper, Nicholas Lee, Shuo Yang, Christopher Chou, Banghua Zhu, Lianmin Zheng, Kurt Keutzer, Joseph Gonzalez 0001, and Ion Stoica
Published: 2024

29. AlpaServe: Statistical Multiplexing with Model Parallelism for Deep Learning Serving.

Author: Zhuohan Li 0001, Lianmin Zheng, Yinmin Zhong, Vincent Liu 0001, Ying Sheng 0007, Xin Jin 0008, Yanping Huang, Zhifeng Chen, Hao Zhang 0025, Joseph E. Gonzalez, and Ion Stoica
Published: 2023

30. Take Out the TraChe: Maximizing (Tra)nsactional Ca(che) Hit Rate.

Author: Audrey Cheng, David C. Y. Chu, Terrance Li, Jason Chan, Natacha Crooks, Joseph M. Hellerstein, Ion Stoica, and Xiangyao Yu
Published: 2023

31. ExoFlow: A Universal Workflow System for Exactly-Once DAGs.

Author: Siyuan Zhuang, Stephanie Wang, Eric Liang, Yi Cheng, and Ion Stoica
Published: 2023

32. Cilantro: Performance-Aware Resource Allocation for General Objectives via Online Feedback.

Author: Romil Bhardwaj, Kirthevasan Kandasamy, Asim Biswal, Wenshuo Guo, Benjamin Hindman, Joseph Gonzalez 0001, Michael I. Jordan, and Ion Stoica
Published: 2023

33. Leveraging Cloud Computing to Make Autonomous Vehicles Safer.

Author: Peter Schafhalter, Sukrit Kalra, Le Xu, Joseph E. Gonzalez, and Ion Stoica
Published: 2023
Full Text: View/download PDF

34. Efficient Memory Management for Large Language Model Serving with PagedAttention.

Author: Woosuk Kwon, Zhuohan Li 0001, Siyuan Zhuang, Ying Sheng 0007, Lianmin Zheng, Cody Hao Yu, Joseph Gonzalez 0001, Hao Zhang 0025, and Ion Stoica
Published: 2023
Full Text: View/download PDF

35. SkyPilot: An Intercloud Broker for Sky Computing.

Author: Zongheng Yang, Zhanghao Wu, Michael Luo, Wei-Lin Chiang, Romil Bhardwaj, Woosuk Kwon, Siyuan Zhuang, Frank Sifei Luan, Gautam Mittal, Scott Shenker, and Ion Stoica
Published: 2023

36. Skyplane: Optimizing Transfer Cost and Throughput Using Cloud-Aware Overlays.

Author: Paras Jain 0001, Sam Kumar, Sarah Wooders, Shishir G. Patil, Joseph E. Gonzalez, and Ion Stoica
Published: 2023

37. SHEPHERD: Serving DNNs in the Wild.

Author: Hong Zhang 0025, Yupeng Tang, Anurag Khandelwal, and Ion Stoica
Published: 2023

38. Exoshuffle: An Extensible Shuffle Architecture.

Author: Frank Sifei Luan, Stephanie Wang, Samyukta Yagati, Sean Kim, Kenneth Lien, Isaac Ong, Tony Hong, SangBin Cho, Eric Liang, and Ion Stoica
Published: 2023
Full Text: View/download PDF

39. FlexGen: High-Throughput Generative Inference of Large Language Models with a Single GPU.

Author: Ying Sheng 0007, Lianmin Zheng, Binhang Yuan, Zhuohan Li 0001, Max Ryabinin, Beidi Chen, Percy Liang, Christopher Ré, Ion Stoica, and Ce Zhang 0001
Published: 2023

40. CLUTR: Curriculum Learning via Unsupervised Task Representation Learning.

Author: Abdus Salam Azad, Izzeddin Gur, Jasper Emhoff, Nathaniel Alexis, Aleksandra Faust, Pieter Abbeel, and Ion Stoica
Published: 2023

41. FogROS2: An Adaptive Platform for Cloud and Fog Robotics Using ROS 2.

Author: Jeffrey Ichnowski, Kaiyuan Chen, Karthik Dharmarajan, Simeon Adebola, Michael Danielczuk, Victor Mayoral Vilches, Nikhil Jha, Hugo Zhan, Edith LLontop, Derek Xu, Camilo Buscaron, John Kubiatowicz, Ion Stoica, Joseph Gonzalez 0001, and Ken Goldberg
Published: 2023
Full Text: View/download PDF

42. Pie: Pooling CPU Memory for LLM Inference.

Author: Yi Xu, Ziming Mao, Xiangxi Mo, Shu Liu, and Ion Stoica
Published: 2024
Full Text: View/download PDF

43. Specifications: The missing link to making the development of LLM systems an engineering discipline.

Author: Ion Stoica, Matei Zaharia, Joseph Gonzalez 0001, Ken Goldberg, Koushik Sen, Hao Zhang 0025, Anastasios Angelopoulos, Shishir G. Patil, Lingjiao Chen, Wei-Lin Chiang, and Jared Quincy Davis
Published: 2024
Full Text: View/download PDF

44. A Statistical Framework for Ranking LLM-Based Chatbots.

Author: Siavash Ameli, Siyuan Zhuang, Ion Stoica, and Michael W. Mahoney
Published: 2024
Full Text: View/download PDF

45. VisionArena: 230K Real World User-VLM Conversations with Preference Labels.

Author: Christopher Chou, Lisa Dunlap, Koki Mashita, Krishna Mandal, Trevor Darrell, Ion Stoica, Joseph E. Gonzalez, and Wei-Lin Chiang
Published: 2024
Full Text: View/download PDF

46. GameArena: Evaluating LLM Reasoning through Live Computer Games.

Author: Lanxiang Hu, Qiyu Li, Anze Xie, Nan Jiang, Ion Stoica, Haojian Jin, and Hao Zhang 0025
Published: 2024
Full Text: View/download PDF

47. BlendServe: Optimizing Offline Inference for Auto-regressive Large Models with Resource-aware Batching.

Author: Yilong Zhao, Shuo Yang, Kan Zhu, Lianmin Zheng, Baris Kasikci, Yang Zhou, Jiarong Xing, and Ion Stoica
Published: 2024
Full Text: View/download PDF

48. MoE-Lightning: High-Throughput MoE Inference on Memory-constrained GPUs.

Author: Shiyi Cao, Shu Liu, Tyler Griggs, Peter Schafhalter, Xiaoxuan Liu, Ying Sheng 0007, Joseph E. Gonzalez, Matei Zaharia, and Ion Stoica
Published: 2024
Full Text: View/download PDF

49. HashAttention: Semantic Sparsity for Faster Inference.

Author: Aditya Desai, Shuo Yang, Alejandro Cuadron, Ana Klimovic, Matei Zaharia, Joseph E. Gonzalez, and Ion Stoica
Published: 2024
Full Text: View/download PDF

50. NEO: Saving GPU Memory Crisis with CPU Offloading for Online LLM Inference.

Author: Xuanlin Jiang, Yang Zhou, Shiyi Cao, Ion Stoica, and Minlan Yu
Published: 2024
Full Text: View/download PDF

Catalog

Books, media, physical & digital resources

See catalog results

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Language

Category

Publication Type

Journal

Database

Publisher

781 results on '"Ion Stoica"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources