Зміст:
Визначення - Що означає Apache Lucene?
Apache Lucene - це проект з відкритим кодом для високопродуктивної та повнофункціональної бібліотеки пошукової системи тексту, який повністю написаний за допомогою Java.
Він здатний до повнотекстового пошуку в документах, тому це технологія, яка підходить для будь-якої програми, яка вимагає цієї функції, особливо якщо вона є кросплатформою.
Вперше він був розроблений Дугом Різком у 1999 році та офіційно став частиною сімейного проекту Джакарта фонду Apache з відкритими джерелами Java у вересні 2001 року. Він був перетворений на проект Apache вищого рівня в лютому 2005 року.
Техопедія пояснює Apache Lucene
Apache Lucene - це високоефективна пошукова система з концепцією "документа, що містить текстові поля" в основі своєї логічної архітектури. Це забезпечує велику гнучкість і дозволяє API Lucene стає незалежним від будь-якого формату файлу.
Будь-який текст із форматів, таких як MS Word, HTML, XML, PDF та OpenDocument, може індексуватися до тих пір, поки текстова інформація може бути вилучена, а це означає, що вона не може нічого робити із зображеннями.
Lucene підходить для будь-якої програми, яка потребує повної індексації тексту та пошуку, але вона широко визнана як чудова утиліта для впровадження Інтернет-пошукових систем та для локального пошуку на одному сайті.
Особливості включають:
- Масштабована та високоефективна індексація - вона може обробляти понад 150 Гбіт на годину на сучасному апаратному забезпеченні та вимагає лише 1 Мб на купу пам'яті.
- Потужні, точні та ефективні алгоритми пошуку - вони пропонують багато типів потужних запитів, таких як запити фрази, підстановки, близькості та діапазону. Він також проводив пошук і сортування за будь-яким полем.
- Крос-платформа - чиста реалізація Java, а також доступна в інших мовах програмування.
