Deterministic AI Language Protocol for Vietnamese Giao thức Ngôn ngữ AI Deterministic tối ưu cho Tiếng Việt
This document defines the core protocol, acoustic rationale, and deterministic guarantees of the Ri‑Lingua (K#) system for use in AI models, tooling, and Vietnamese language infrastructure.
Ri-Lingua is the first Deterministic Language Protocol for Vietnamese AI — not just an input method, but a Phonological Operating System (Phonological OS). It compresses all orthographic and acoustic complexity of Vietnamese into pure ASCII format through the KHD_CAP matrix.
Within the RI-Ecosys architecture, Ri-Lingua serves as the Clean Protocol Layer — designed to solve these core problems:
It creates a Clean Protocol Layer for:
Ri-Lingua là Giao thức Ngôn ngữ Deterministic đầu tiên cho AI tiếng Việt — không chỉ là bộ gõ thông thường, mà là một Hệ điều hành Âm vị học (Phonological OS). Giao thức này nén toàn bộ dữ liệu chính tả và âm học phức tạp của tiếng Việt vào định dạng ASCII thuần thông qua ma trận KHD_CAP.
Trong kiến trúc RI-Ecosys, Ri-Lingua đóng vai trò là Lớp Giao tiếp Sạch (Clean Protocol Layer) — được thiết kế để giải quyết các vấn đề cốt lõi:
Nó tạo ra Lớp Giao tiếp Sạch cho:
| Protocol Type | Deterministic phonological encoding for Vietnamese |
| Character Set | 18 CAP characters (ASCII A–Z subset) |
| Reversibility | 100% lossless K# ↔ Chữ Quốc Ngữ |
| Token Impact | ~53% token reduction (vs raw Unicode CQN) |
| Shimmer Risk | 0% (diacritics removed from the channel) |
| Primary Use Cases | LLM training, TTS/ASR, linguistic tooling, low-bandwidth channels |
Ri-Lingua operates on two protocol layers:
Ri-Lingua hoạt động trên hai tầng giao thức:
The core of K# is a matrix of 18 CAP characters, encoding the intersection of 6 tones (Frequency vs Time) and 3 vowel morphology states (Plain, Hat, Hook).
Cốt lõi của K# là ma trận 18 ký tự CAP, mã hóa giao thoa giữa 6 thanh điệu (Tần số vs Thời gian) và 3 trạng thái hình thái nguyên âm (Plain, Hat, Hook).
| TONETHANH | PLAIN (—) | HAT (↑) | HOOK (↓) |
|---|---|---|---|
| Ngang (Level) | N | Y | M |
| Sắc (Rising) | S | T | X |
| Hỏi (Dipping) | Q | B | V |
| Huyền (Falling) | L | D | K |
| Ngã (Broken) | Z | G | R |
| Nặng (Heavy) | P | F | H |
N–Y–M → Normal – Youth – MildS–T–X → Sharp – Top – eXitQ–B–V → Question – Bounce – ValleyL–D–K → Low – Down – KnockdownZ–G–R → Zigzag – Go up – RuptureP–F–H → Pause – Force – HeavyComplete elimination of diacritic ambiguity. The CAP-First rule isolates the terminal character to identify the tone instantly.
Triệt tiêu hoàn toàn sự mơ hồ dấu thanh. Quy tắc CAP-First tách ký tự cuối để định danh thanh điệu tức thì.
Condenses orthographic data into pure ASCII, reducing required tokens by up to 53%.
Nén dữ liệu chính tả vào định dạng ASCII thuần, giảm tới 53% lượng token cần thiết.
100% reversible decoding back to Chữ Quốc Ngữ without information loss. Examples: mạnh → mafH | người → wolK.
Giải mã ngược 100% về chữ Quốc Ngữ mà không mất mát thông tin. Ví dụ: mạnh → mafH | người → wolK.
90% alignment with actual pitch contours (F₀). Each CAP character encodes dynamic sound behavior.
Khớp nối 90% với quỹ đạo cao độ thực tế (F₀). Mỗi ký tự CAP mã hóa hành vi âm thanh động.
| CQN (Vietnamese) | K# (Simplified) | Example |
|---|---|---|
| ươi / uôi | ol | người → wolK, tuổi → tolB |
| iêu | iu | điều → yiuL, tiêu → tiuY |
| yêu | yu | yêu → yuY |
| uyê / uyên | yl / yln | tuyên → tylnY, khuyên → qylnY |
| oai / oay | oy | ngoài → woyL, xoay → xoyN |
| CQN | K# | Note |
|---|---|---|
| th | th | Giữ nguyên (Keep as-is) |
| tr | j | trẻ → jeQ |
| ch | f | chào → faoL |
| nh | z | như → zuM |
| kh | q | không → qowY |
| ng / ngh | w | người → wolK, nghĩ → wiG |
| ph | p | phở → poR |
| đ | y | đẹp → yepP |
| gi / qu | gi / qu | Giữ nguyên (Keep as-is) |
| k / c | k / c | Giữ nguyên (No normalize) |
📜 Ri‑Lingua is an open standard for Vietnamese AI.
This system does not replace Quốc Ngữ legally, but exists as an Intermediary Protocol Layer to ensure absolutely accurate communication between AI and humans in the digital era. K# Tone Academy (6 Lessons) is the foundational training layer to master the acoustic logic required for RI-Ecosys compliance.
📜 Ri‑Lingua là một chuẩn mở dành cho AI tiếng Việt.
Hệ thống này không thay thế chữ Quốc Ngữ về pháp lý, mà tồn tại như một lớp giao thức trung gian (Intermediary Protocol Layer) để đảm bảo giao tiếp chính xác tuyệt đối giữa AI và con người trong kỷ nguyên số. K# Tone Academy (6 Bài học) là tầng huấn luyện nền tảng để nắm vững logic âm học cần thiết cho việc tuân thủ RI-Ecosys.
— Ba Tran, Founder of Resontologic & RI-Ecosys Collective Dev Team "Ri-Lingua không chỉ là mã hóa — nó là một Hệ điều hành Âm vị học (Phonological OS). Bằng cách tái định nghĩa thanh điệu thành 'Tính cách âm thanh' và áp dụng quy tắc CAP-First, chúng tôi loại bỏ hoàn toàn sự mơ hồ trong xử lý tiếng Việt."
— Ba Tran, Founder of Resontologic & RI-Ecosys Collective Dev Team