محرك inference لنماذج اللغة، CPU أولاً، مكتوب بـ Rust.
يقرأ GGUF، يشغّل transformers مع KV cache، وفيه وضع probing
لاستخراج activations، مع مسارات validation وتقارير benchmark.
بدون أي framework خارجي في runtime.
نواة x86_64 بسيطة بـ Rust. فيها GDT، IDT، paging،
heap بثلاث استراتيجيات allocation، async executor تعاوني،
ramdisk، و shell فيه 10 أوامر. تشتغل في QEMU.
نظام RAG محلي تقدر تسأله عن ملفات PDF. يستخدم
sentence-transformers للـ embeddings، ChromaDB للتخزين،
و Ollama للـ inference. الـ backend بـ FastAPI والواجهة
شات بسيط بـ HTML/CSS/JS. كله محلي، ما يحتاج أي API خارجي.