Компания Lexar разрабатывает программно-аппаратный комплекс, который позволяет запускать большие языковые модели на системах с ограниченным объёмом оперативной памяти. Технология использует твердотельные накопители (NAND Flash) для выгрузки части данных модели, что уменьшает зависимость от дорогостоящей DRAM. Стоимость производства DRAM примерно в шесть раз превышает затраты на выпуск NAND-флеш, и новое решение призвано снизить барьер входа для локального развёртывания ИИ.
В основе комплекса лежит Storage Processing Unit (SPU) — собственный контроллер Lexar, выполненный по 5-нанометровому техпроцессу с архитектурой без DRAM-буфера. Интеллектуальный механизм планирования задач, оптимизированный для периферийного ИИ, позволяет сократить потребность в DRAM примерно на 40% за счёт алгоритмов упреждающей выборки и управления кешем. Система адресует проблемы, характерные для архитектур смеси экспертов (MoE), включая быстрый рост кеша ключей-значений (KV Cache) и задержки ввода-вывода.
В ходе внутренних испытаний инженеры Lexar запустили модель Qwen 3.5 с 122 миллиардами параметров на компьютере с 32 гигабайтами DRAM. Обычно для такой модели потребовалась бы система стоимостью около 4500 долларов с 128 гигабайтами памяти. С использованием нового решения скорость генерации достигла 4,4 токена в секунду при загрузке модели на накопитель и 15,6 токена при работе в стандартной конфигурации. Традиционный фреймворк Llama.cpp при попытке загрузить модель на 32 гигабайтах памяти завершал работу с ошибкой.
На выставке Computex 2026 Lexar представила концепт портативного накопителя AI Storage Stick, совместимого с прототипом мини-ПК от ASUS. Устройство в металлической оболочке вставляется в слот M.2 на лицевой панели, обеспечивая прямое подключение к процессору или чипсету без дополнительных посредников. Такое решение позволяет использовать SSD как съёмный модуль расширения памяти для ИИ-моделей.
Параллельно компания выпускает твердотельный накопитель NM1090 PRO PCIe Gen5 x4 объёмом до 8 терабайт с последовательной скоростью чтения 14400 мегабайт в секунду и записи 13400 мегабайт в секунду. Производительность случайного чтения и записи достигает 2000K и 2100K операций ввода-вывода в секунду соответственно. Накопитель оснащён 8 гигабайтами независимой DRAM-кеша и SLC-динамическим кешем, а его контроллер на 6-нанометровом техпроцессе снижает пиковую температуру на 36% по сравнению с 12-нанометровыми предшественниками.
По данным исследовательской компании Gartner, в 2026 году объём поставок AI PC достигнет 143 миллионов единиц, что составит 55% всего рынка персональных компьютеров. Разработки Lexar в области ИИ-ориентированных хранилищ данных направлены на удовлетворение потребностей этого сегмента. В партнёрстве с ASUS компания также демонстрирует решения для игровых портативных устройств и высокопроизводительных систем.
