Art Atk

ArtAtk

AI & ML interests

Multimodal Models

Recent Activity

liked a Space about 17 hours ago

ACE-Step/ACE-Step

upvoted a paper about 20 hours ago

RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference

upvoted a paper about 20 hours ago

FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios

View all activity

Organizations

None yet

ArtAtk's activity

liked a Space about 17 hours ago

146

ACE Step

😻

A Step Towards Music Generation Foundation Model

upvoted 2 papers about 20 hours ago

RetroInfer: A Vector-Storage Approach for Scalable Long-Context LLM Inference

Paper • 2505.02922 • Published 3 days ago • 21

FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios

Paper • 2505.03730 • Published 2 days ago • 25

upvoted a paper 14 days ago

DreamID: High-Fidelity and Fast diffusion-based Face Swapping via Triplet ID Group Learning

Paper • 2504.14509 • Published 19 days ago • 50

upvoted a paper 16 days ago

Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation

Paper • 2504.14899 • Published 18 days ago • 20

upvoted a paper 21 days ago

WORLDMEM: Long-term Consistent World Simulation with Memory

Paper • 2504.12369 • Published 22 days ago • 32

upvoted 2 papers 24 days ago

GigaTok: Scaling Visual Tokenizers to 3 Billion Parameters for Autoregressive Image Generation

Paper • 2504.08736 • Published 27 days ago • 47

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper • 2504.08685 • Published 27 days ago • 123

upvoted a paper 28 days ago

VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Paper • 2504.07960 • Published 28 days ago • 46

liked a model about 1 month ago

Skywork/SkyReels-A2

Updated about 1 month ago • 1.33k • 126

upvoted 6 papers about 1 month ago

Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation

Paper • 2504.02542 • Published Apr 3 • 44

Any2Caption:Interpreting Any Condition to Caption for Controllable Video Generation

Paper • 2503.24379 • Published Mar 31 • 76

Synthetic Video Enhances Physical Fidelity in Video Synthesis

Paper • 2503.20822 • Published Mar 26 • 16

Latent Space Super-Resolution for Higher-Resolution Image Generation with Diffusion Models

Paper • 2503.18446 • Published Mar 24 • 10

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published Mar 24 • 118

FFN Fusion: Rethinking Sequential Computation in Large Language Models

Paper • 2503.18908 • Published Mar 24 • 19

upvoted a paper about 2 months ago

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

Paper • 2503.13358 • Published Mar 17 • 96

liked a Space about 2 months ago

130

Hunyuan3D 2mini Turbo

🔥

Fast Images-to-3D Generation within 1 Second

upvoted 2 papers about 2 months ago

ReCamMaster: Camera-Controlled Generative Rendering from A Single Video

Paper • 2503.11647 • Published Mar 14 • 140

DiT-Air: Revisiting the Efficiency of Diffusion Model Architecture Design in Text to Image Generation

Paper • 2503.10618 • Published Mar 13 • 17