Хиймэл оюун ухааны хурдыг нэмэгдүүлэхэд ганцхан тооцоолол хурдан байх хангалтгүй хурдан тооцоолол хийхийн тулд өмнөх тооцооллуудаа хадгалаад хадгалсан мэдээлэл дээрээ үндэслэн шинэ тооцоолол хийх нь хавьгүй хурдан байдаг байна. Энэ сэдвээр илүү судалмаар байвал KV cache-ийн талаар олж уншаарай