33 9 91

raincandy_U

raincandy-u

AI & ML interests

幻覚。

Recent Activity

posted an update about 5 hours ago

🤗 Just released Rain-100M, an experimental ~97M-parameter Qwen3-style language model trained from random initialization. Repo: https://huggingface.co/raincandy-u/Rain-100M Data: https://huggingface.co/datasets/HuggingFaceFW/fineweb-edu, ~3B tokens, English only Tokenizer: custom 16k BPE, context length 4096 Architecture: 12 Transformer layers, hidden size 768, 12 heads, MLP 2048, SiLU, bf16 Rain-100M is a raw base model (not instruction-tuned or safety-aligned), aimed at small-scale research, debugging training pipelines, and CPU/edge experiments. If you run evaluations, finetunes, or visualizations with it, I would be very interested in your results!

liked a dataset about 8 hours ago

Skywork/SkyPile-150B

updated a model about 9 hours ago

raincandy-u/Rain-100M

View all activity

Organizations

New activity in raincandy-u/VOCALOID_songs 10 days ago

[bot] Conversion to Parquet

#1 opened 10 days ago by

parquet-converter

New activity in raincandy-u/Tiny-Philosopher-50k 10 days ago

[bot] Conversion to Parquet

#1 opened 24 days ago by

parquet-converter

New activity in raincandy-u/TinyChat over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in raincandy-u/TinyStoriesV2_SpecialTokens over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in 01-ai/Yi-1.5-9B-Chat-16K over 1 year ago

eos_token clarification

😔 2

#1 opened over 1 year ago by

Starlento

New activity in jieliu/Storm-7B over 1 year ago

perfect work! gguf plz.

#1 opened over 1 year ago by

wukongai

New activity in raincandy-u/tiny-codes-alpaca-100k over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in raincandy-u/Llama-3-Aplite-Instruct-4x8B-MoE over 1 year ago

Adding Evaluation Results

#7 opened over 1 year ago by

leaderboard-pr-bot

Wrong link in readme

#6 opened over 1 year ago by

yamatazen

New activity in raincandy-u/glaive_code_assistant_v3_resample_95k over 1 year ago

[bot] Conversion to Parquet

#1 opened almost 2 years ago by

parquet-converter

New activity in x-angelkawaii-x/wildchat-tiny-20k over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in raincandy-u/claudy-chat-CJK-5k over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in raincandy-u/Llama-3-Aplite-Instruct-4x8B-MoE over 1 year ago

Adding Evaluation Results

#8 opened over 1 year ago by

leaderboard-pr-bot

New activity in raincandy-u/phillama-3.8b-v0.1 over 1 year ago

GGUF imatrix quants for this model

#1 opened over 1 year ago by

iyadycb

New activity in raincandy-u/Llama-3-Aplite-Instruct-4x8B-GGUF-MoE over 1 year ago

Surprising results

#1 opened almost 2 years ago by

Utochi

New activity in raincandy-u/Dextromethorphan-50k-v0.1 over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in vonjack/Phi-3-mini-4k-instruct-LLaMAfied over 1 year ago

Could you please make a 128k version?

#5 opened over 1 year ago by

raincandy-u

New activity in raincandy-u/Dextromethorphan-10k over 1 year ago

[bot] Conversion to Parquet

#1 opened over 1 year ago by

parquet-converter

New activity in microsoft/Phi-3-mini-4k-instruct almost 2 years ago

Instruction mode output garbage in text-generation-webui

#14 opened almost 2 years ago by

raincandy-u

New activity in raincandy-u/Llama-3-Aplite-Instruct-4x8B-MoE almost 2 years ago

did this have degenerate routing?

#4 opened almost 2 years ago by

Kquant03

raincandy_U

AI & ML interests

Recent Activity

Organizations

raincandy-u's activity

[bot] Conversion to Parquet

[bot] Conversion to Parquet

[bot] Conversion to Parquet

[bot] Conversion to Parquet

eos_token clarification

perfect work! gguf plz.

[bot] Conversion to Parquet

Adding Evaluation Results

Wrong link in readme

[bot] Conversion to Parquet

[bot] Conversion to Parquet

[bot] Conversion to Parquet

Adding Evaluation Results

GGUF imatrix quants for this model

Surprising results

[bot] Conversion to Parquet

Could you please make a 128k version?

[bot] Conversion to Parquet

Instruction mode output garbage in text-generation-webui

did this have degenerate routing?