Talha Rüzgar Akkuş's picture

Talha Rüzgar Akkuş

Q-bert

·

AI & ML interests

AI, NLP, Math Hypothesis,NP Problems,Competitive programming

Recent Activity

updated a dataset 9 days ago

Q-bert/ChessReasoningDataset

updated a dataset 9 days ago

Q-bert/ChessReasoningDataset

updated a dataset 9 days ago

Q-bert/ChessReasoningDataset

View all activity

Organizations

Q-bert's activity

upvoted a paper 17 days ago

Thought Manipulation: External Thought Can Be Efficient for Large Reasoning Models

Paper • 2504.13626 • Published 20 days ago • 8

upvoted a paper 23 days ago

PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

Paper • 2504.08791 • Published about 1 month ago • 129

upvoted a paper about 1 month ago

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published Mar 30 • 133

upvoted 2 papers about 2 months ago

Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models

Paper • 2503.09573 • Published Mar 12 • 71

Forgetting Transformer: Softmax Attention with a Forget Gate

Paper • 2503.02130 • Published Mar 3 • 32

upvoted a paper 2 months ago

Chain of Draft: Thinking Faster by Writing Less

Paper • 2502.18600 • Published Feb 25 • 48

upvoted a paper 3 months ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published Feb 4 • 229

upvoted an article 3 months ago

Article

Welcome to Inference Providers on the Hub 🔥

Jan 28

• 478

upvoted a paper 4 months ago

Enhancing Human-Like Responses in Large Language Models

Paper • 2501.05032 • Published Jan 9 • 57

upvoted a collection 5 months ago

Human-Like LLMs

Human-Like LLMs series. • 5 items • Updated Jan 20 • 13

upvoted a paper 7 months ago

Were RNNs All We Needed?

Paper • 2410.01201 • Published Oct 2, 2024 • 52

upvoted a paper 8 months ago

Diffusion Models Are Real-Time Game Engines

Paper • 2408.14837 • Published Aug 27, 2024 • 126

upvoted 2 papers over 1 year ago

TURNA: A Turkish Encoder-Decoder Language Model for Enhanced Understanding and Generation

Paper • 2401.14373 • Published Jan 25, 2024 • 11

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 143

upvoted a collection over 1 year ago

Mamba

Mamba SSM Models with hf_integration. • 7 items • Updated Dec 28, 2023 • 7

upvoted a paper over 1 year ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 170