Liwei Jiang's picture

2 3 3

Liwei Jiang

liweijiang

·

liweijiang

AI & ML interests

None yet

Recent Activity

authored a paper 6 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

upvoted a paper 6 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

updated a dataset 3 months ago

liweijiang/panorama_train_v1_deduped

View all activity

Organizations

liweijiang's activity

upvoted a paper 6 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

Paper • 2504.13203 • Published 13 days ago • 30

upvoted 2 papers 10 months ago

WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

Paper • 2406.18495 • Published Jun 26, 2024 • 13

WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models

Paper • 2406.18510 • Published Jun 26, 2024 • 9