Сервис оценки читаемости:
- сайт для проверки — http://ru.readability.io
- доступ к сервису по API — https://github.com/ivbeg/ readability.io/wiki/API
Ресурсы по русскому языку
- обучающая выборка текстов https://github.com/ infoculture/plainrussian
- Корпус русского языка — http://ruscorpora.ru/ включая данные по частотам слов — http://ruscorpora.ru/ corpora-freq.html
Алгоритмы читаемости текстов для английского языка:
- Flesch-Kinkaid -http://en.wikipedia.org/wiki/
Flesch%E2%80%93Kincaid_ readability_tests - Dale-Chale readability formula -http://en.wikipedia.org/wiki/
Dale%E2%80%93Chall_ readability_formula - Coleman-Liau index -http://en.wikipedia.org/wiki/
Coleman%E2%80%93Liau_index - SMOG — http://en.wikipedia.org/
wiki/SMOG - Automated Readability Index -http://en.wikipedia.org/wiki/
Automated_Readability_Index
Библиотеки с открытым исходным кодом:
- большая коллекция библиотек по обработке текстов — http://nlpub.ru/%D0%9E%D0% B1%D1%80%D0%B0%D0%B1%D0%BE%D1% 82%D0%BA%D0%B0_%D1%82%D0%B5% D0%BA%D1%81%D1%82%D0%B0
- Томита парсер — http://api.yandex.ru/tomita/
- библиотеки стемминга слов — https://ru.wikipedia.org/ wiki/%D1%F2%E5%EC%EC%E8%ED%E3
- библиотека обработки текстов NLTK — http://text-processing.com/
- автоматическая обработка текстов — http://aot.ru/