[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Поиск в базе книг запрещенной литературы
Anika_RB
Добрый день, уважаемые мастера-кодеры и начинающие эксперты.

Прошу помочь в одной, как я думаю, несложной для Вас, но очень критичной для меня проблеме.
В данный момент я нахожусь в лечебном учреждении "полузакрытого типа" в качестве обслуживающего персонала и заодно ещё получил в обязанность мониторинг за библиотекой и местным клубом.
В нашей библиотеке порядка 3500 книг, есть база всех книг в формате Excel.
Как государственному учреждению нам в прошлом году поступило распоряжение проверить весь список книг по списку экстремистской литературы.
Список выкладывается в свободном доступе на сайте МинЮста, легко экспортируется в csv, pdf.
minjust. ru /ru/extremist-materials
Мой предшественник в прошлом году собрал программу поиска, которую, как оказывается успели раздать по всей области в подобные учреждения.
Выглядит это как установщик Denwer'a, с сайтом и движками php и библиотекой phpExcel. Но сказали, что типа "недавно скрипт начал глючить" и находить лишнюю литературу. Проверили - находит в списке литературу, не указанную в списке.
Как всегда и бывает в нашей стране мне просто поставили задачу к пятнице сделать рабочую версию.
Программирование я вообще учил уже 20 лет назад, вроде суть понимаю, но разобраться в такие сроки никакой возможности нет. Да и php как такового у нас не было.

В общем, в денвере простой сайтик с 5 функциями:
1. загрузка файла библиотеки книг (в формате xls)
2. загрузка файла запрещенной литературы (там указано, что нужно сохранить файл в формате txt)
3. проверка библиотеки онлайн с сайта минюста
4. проверка библиотеки оффлайн по подгруженной базе запрещенных книг (из п.2)
5. создание книжных карточек (вообще не важна)

каждая функция на отдельном .php файле.

Как я понял весь скрипт поиска умещается в следующий фрагмент:
/////////////////
function _found_book($book_name){
global $books_txt;
if (strstr($books_txt, $book_name)){
return true;
}
return false;
}
/////////////////

Все остальное - работа с выдачей и подгрузкой переменных во внутренние массивы данных.


Проблема в том, что на сайте минюста куча мусора в базе: лозунги, интернет ресурсы, страницы ВК, посты ЖЖ и т.п.
И то, что попало туда выдается потом в выдаче поиска по списку запрещенной литературы.

Не знаю, как правильно сделать "умную" выборку: возможно, отфильтровать список с минюста, чтобы там остались только печатные издания, а при совпадении названия ещё смотрелся и автор.

Уважаемые пользователи! Знаю, что для вас это сверхтривиальная задача, хотя может кому и интересно будет потратить несколько минут на поиск решения. Очень прошу помочь сделать рабочий алгоритм. В этом же формате (php с денвером), любом другом: исполняемый файл, макрос экселя, что угодно, лишь бы я мог дать готовое рабочее решение, которое будет работать со следуюющими исходными данными:
1. Excel база книг библиотеки:
№ п/п № в реестре Название Ф.И.О. автора
2. Список экстремисткой литературы с сайта МинЮста.

На выходе должны найтись совпадения со списком книг и их данными из п.1



Очень прошу помочь. Сами понимаете, что подобная работа не позволяет мне жить на широкую ногу, но работа эта очень нужна, а положение будет расшатано, если я не справлюсь с этой проблемой. В предыдущем предложении описывается и причина, по которой я не могу нанять кодера для написания скрипта =( Но при первой же возможности отблагодарю автора рабочего решения.

Искренне надеюсь на Ваше понимание и содействие.
Прикладываю сразу весь пак:
1. папку с сайтом из денвера с библиотекой phpExcel
2. список книг библиотеки
3. список запрещенной литературы
dropmefiles . com/G6XjC
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.