Лемма — исходная, неизменённая форма слова. Для глаголов — форма, отвечающая на вопрос «что делать». Для существительных — именительный падеж единичного числа.
Лемматизация — процесс морфологического анализа текстов для поиска лемм. Используется поисковыми машинами при индексации веб-сайтов. Метод лемматизации позволяет хранить данные о каждой веб-странице у себя в индексе в виде набора слов, которые приведены к общему знаменателю. По своей сути, этот метод позволяет сократить словоформы, которые поисковик должен обработать. Как результат — повышается скорость индексации страниц сайтов и ускоряется ответ на поисковый запрос.