Скрипт-генератор контента для WordPress

Скрипт предназначен для сайтов на движке WordPress. Выгрузка на сайт осуществляется через импорт xml-файла в админке, картинки лучше загружать отдельно по фтп. В ходе выгрузки автоматом создаются (если их не было) нужные разделы и записи.
Тематика: объявления о продаже автомобилей. 


Генерирует поля:

  • Название (модель и марка)
  • Фотография машины
  • Год выпуска
  • Опции
  • Руль
  • Состояние машины
  • Аудио система
  • Лошадиные силы
  • Объем
  • Окрас (название и цвет)
  • Коробка
  • Привод
  • Двигатель
  • Контактная инфа
  • Город
  • Адрес
  • ФИО
  • Телефон
  • Цена

Скриншот страницы с генерированным контентом:
скришот сайта с генерированным контентом
Уникальность текста 100%

Уникальность генерированного текста


Как монетизировать?
На мой взгляд оптимальное решение — продажа ссылок через sape и другие биржы.
Два основных способа монетизации:

  1. Агресиный — промышленное создание таких сайтов, максимальная монетизация до получения фильтра. Не спешите удалять сайт после АГС или бана. Сайты в даже в бане приносят небольшой, но стабильный доход.
    Скриншот доходов из сапы с монетизацией по такой схеме:
    Доход в сапе
  2. Умеренный — создание меньшего числа сайтов, акцент переносится на качество. Напишите для сайта несколько уникальных статей, купите ссылок для поднятия ТИЦ (или домен дроп). Это позволит отсрочит получения фильтров и повысит доход.

Как пользоваться генератором

На странице скрипта-генератора контента указываем начальную и конечную дату.
Записи будут генерироваться для этого временного интервала. Причем можно указать интервал в прошлом — тогда записи будут задним числом, либо будущим — тогда записи будут запланированы.
Если записей на сайте не было, то рекомендую поставить прошлый месяц и будущий.
Указываем количество записей в день. Столько записей будет генерироваться для каждого дня из интервала, время публикации выбираться случайным образом.
Стоит учесть, что стоит ограничение на генерацию — не более 500 страниц. Т.е. Если вы указала начальную дату 01.01.2011 и конечную 01.01.2012 с публикацией по 5 записей в день, то скрипт выдаст ошибку «error! ограничение: вы пытаетесь сгенерировать более 500 записей!». Оно и понятно, вы хотели сгенерировать аж 365*5=1825 записей. Данное ограничение нужно для того чтобы пользователи (умышленно или нечайно) не повесели сервер.

Затем указываем полный адрес сайта. Например: http://kashinas.ru
Вводим результат решения с капчи и жмем генерировать.

Процесс генерации может занять определенное время, зависит от загруженности сервера. Обычно за секунду генерируется чуть больше 3-х записей.

Когда процесс генерации завершен вам будет предложено скачать все одним архивом.
В архиве:

  • файл «file-import.xml» — его нужно импортировать через админку вашего вордпресса
  • папка «images» с картинками — залить в корень сайта по ftp.

Для импорта файла входим в админку вордпресса. Жмем «Инструменты»-«Импорт» и выбираем «WordPress»

Жмем «обзор», выбираем файл «file-import.xml», нажимаем «Загрузить и импортировать файл»
На следующей странице рекомендую сменить имя автора, в поле «as a new user» указать, например, «admin».

Все готово. Не забудьте скопировать картинки.

63 Комментарии。

  1. Serg

    Задаю генерацию на год, по 5 постов\в день и…
    >error! ограничение: вы пытаетесь сгенерировать более 500 записей!

    сие не есть гуд.. Мне что, рассчитывать даты?
    Пусть скрипт генерит свои 500.. пускай и не до конечной даты..

    Ну или нужно прикрутить калькулятор перед генерацией 😉 (для вычисления конечной даты)

    • kashinas

      Пожалуй вы правы, полезное замечание. Разрешить генерировать неограниченное число записей не могу (некоторые могут и случайно запустить 1000 записей в день в течение 5 лет) — тут не один сервер не справится.
      А вот ввести калькулятор или подсказки на AJAX — можно!

      • Тут на халяву раздают контент, а вы притензии :mrgreen:

        По мне так нормально. Считать умею. Не ленюсь! 😛

  2. Serg

    И да, на сёрче топик рано или поздно убьют. Бо нарушает правила.

    • kashinas

      Serg, Не пойму кто и какие правила нарушает?

      • Serg

        Запрещено обсуждение ПО для АВТОМАТИЧЕСКОЙ генерации контента.

        forum. срач. ru/showthread.php?t=326799

        Сносились топики и менее «нарушающие».. Как повезёт. Просто будь готов.

        И эта.. поправь, плз, генератор.. Вообще убери или конечную дату, или кол-во постов — пускай скрипт сам их рассчитывает.

        Да, а самим скриптом не поделишься? 😉

        • kashinas

          Спасибо за инфу — не знал.
          Но там написано, что запрещена только продажа (пункт второй) — про обсуждение ничего.
          В общем, надеюсь, что не удалят темку — может кому еще пригодится.
          Скриптом — делится не планировал. Но если напишешь в личку на серче — обсудим (возможно как тестеру дам).

  3. интересно, откуда берётся контент для генерации. парсинг?

    • kashinas

      Контент берется случайным образом из словарей. На данный момент используется 33 словаря, общим размером 191 КБ. Словрь представляет из себя обычный текстовый файл, в котором перечислены варианты. Например, фрагмент словаря «Фамилии»:

      Авдошин
      Авдохин
      Авдотьин
      Авдотьев
      Авдонюшкин
      Авдонов

      Кроме словаря модели автомобилей. Там использован иерархический xml, чтобы было соответствие модели и марки.

  4. Уважаемый, а зачем вы выложили этот скрипт? Смысл? Ведь если человек сделал что-то уникальное, зачем этим делиться с другими, да еще бесплатно, если это приносит реальные деньги?

    • kashinas

      vitvlad, я убежден в том что лучший способ продвинуть сайт — это интересный и уникальный контент или сервис. Проще говоря, я это делаю для развития своего сайта.

  5. А бан поисковиков почему происходит?Если контент уникальный?

    • kashinas

      Бан, а чаще просто фильтр, такие сайты получают за активную торговлю ссылками.
      Как показывает опыт — причиной наложения фильтров часто служит не один фактор, а их совокупность: отсутствие другого контента (кроме объявлений), отсутствие внешних ссылок, резкое увеличение числа страниц, торговля ссылками.
      Поэтому чтобы на дольше закрепится в индексе нужно минимизировать факторы риска: написать несколько уникальных страниц, добавить контакты, получить несколько обратных ссылок, увеличивать число страниц с объявлениями плавно, ссылки с сайта продавать в сапе вручную.

  6. Спасибо! Добавил сервис в закладки!

    • kashinas

      Пожалуйста, постараюсь публиковать полезные записи чаще, чем сейчас.

  7. Интересное решение. Зря я не додумался до такого. Пару лет назад примерно такой же автогенератор запилил. Вышло забавно:

    книга памяти

    • kashinas

      И правда — интересный сайт.
      С технической точки зрения все отлично: в индексе Гугла сейчас 19200 страниц, Яндекса 18000, есть много беков, если не изучать страницы — на генерацию не похоже. Осталось немного нарастить ТИЦ и PR — и зарабатывать в сапе.
      С точки зрения морально-этических норм: я бы на RIP сайтах зарабатывать не стал, думаю найдутся те кто будет, и те кто это осуждает.
      P.S. С RIP-сайтами видел недавно новую фишку для заработка на трафике. Суть: заранее подготавливается страничка о смерти известного человека и занимается топ по этому запросу (еще при жизни человека). В случае смерти в первые сутки (неделю) такая страница получает тонны трафика, который монетизируется. Пример, Стив Джобс, Уитни Хьюстон.
      Сам подобными сайтами не занимаюсь и не планирую заниматься.

  8. Эх, жаль что только автотематика. А так — интересно!

    • kashinas

      А какая вам тематика интересна?

  9. Dmfkeeper

    Добрый день!
    Спасибо за генератор, сделал сайтик, посмотрю что получится. )

    Можно заполучить скриптик для доработки?

    • kashinas

      >Спасибо за генератор, сделал сайтик, посмотрю что получится. )
      Пожалуйста! Если не трудно, то отпишитесь потом здесь о результатах — думаю всем (в том числе и мне) будет интересно.
      >Можно заполучить скриптик для доработки?
      Напишите на почту kashinas @ yandex . ru — обсудим.

      • Dmfkeeper

        Отписал на мыло.

  10. Андрей

    Добрый день!
    А можете написать генератор на другие тематики ( например туризм ) если да,то на каких условиях.Спасибо

    • kashinas

      Добрый день, Андрей.
      Писать на сайт генератор для других тематик не планирую.
      Если не секрет, зачем вам другие тематики? Как сателлиты они все равно не пойдут, только в сапу — а в сапу, по мне, без разницы какой тематики.
      Все же, если есть большое желание — то могу написать платно. Подробности на почту kashinas @ yandex . ru – обсудим.

  11. Да все равно сейчас сателы на основе объявлений улетают под агс, даже если ссылки не продавать! У меня были три таких сата, да еще и с уникальными статьями. Все равно в агс ушли — объявлений больше 1к и гудбай! На одном сате было продано менее 50 ссылок и через два месяца бан, причем отстаивался сат три месяца. Два других с хорошим дизом и тоже с новостями даже без ссылок через четыре месяца попали под агс! Яша оставляет в индексе только старые, уже давно сделанные подобные саты.

    • kashinas

      Вы во многом правы, однако на таких сайтах можно по прежнему зарабатывать — хоть и с бо’льшим трудом. У меня есть сайт (правда не генерация, а сканирование и машинное распознавание) с нулевыми показателями, в бане Яндекс и с доходом в сапе 3 рубля в сутки. По моему не плохо — висит, хлеба не просит.
      До бана было и 50 руб в сутки.
      Урл (убрать пробелы): v y b o r n o v a . r u

      • По чем же вы на нем ссылки продаете7

        • kashinas

          С главной по 5 руб., со второго уровня — 0,5 руб. Третьего УВ — нет

  12. Ну а по поводу «папка “images” с картинками – залить в корень сайта по ftp.» — не все так гладко. Нучно учитывать ЧПУ и прочее. Например при попытке просмотреть записи из архива, т.е. вид ссылок будет, например, ваш_сайт.ру/category/ваш_пост, картинок уже не будет, т.к. они будут искаться в папке ваш_сайт.ру/category/images/
    😆

    • kashinas

      MasterJedi, спасибо за конструктивный совет, учту.
      Просто скрипт не предназначен для «рабочих» сайтов, поэтому можно просто не выводить каталог, а еще лучше — отключить ЧПУ. Ведь ЧПУ в основном нужно для некого бонуса при продвижении, чтобы в в урл вставить ключ. В нашем случае трафик (в т.ч. поисковый) — не главный фактор, от которого можно спокойно отказаться, главное полная индексация всех страниц, а для этих целей нужна просто карта сайта.
      Еще раз спасибо за найденный баг 😉

      • В принципе да, но думал совместными усилиями написать нужное правило для .htaccess
        Ведь когда делаешь что-то похожее на СДЛ, хочется, чтобы все было учтено… 🙄

        • kashinas

          Здесь дело не в htaccess, а в скрипте, который формирует html-код.
          Строчка, формирующая код с картинкой была:
          src='$images_folder/$file_name'
          Сейчас сделал вот так:
          src='/$images_folder/$file_name'

          Т.е. просто добавил слеш в начале, и теперь путь станет не относительным, а абсолютным, т.е. все должно быть ок.

          MasterJedi, проверьте пожалуйста, если ошибки будут — пишите, будем исправлять.

          • kashinas, спасибо сейчас все ок 😎
            Спасибо Вам еще раз за скрипт.
            Конечно хотелось бы больше настроек и возможностей. Например, можно сделать, чтобы метки брались хотя бы из названия категории.

            Вообще если подумать, подобных «улучшений» можно множество придумать.

            Кстати, не думаете, составлять подобные словари по другой тематике? Я бы с радостью принял участие…

          • kashinas

            Серьезных улучшений делать не планирую, т.к. проект не коммерческий, времени не хватает на него.
            А вот тематику другую добавить можно, для этого скрипт даже не придется сильно переделывать.

            Обычный словарь представляет из себя простой текстовый файл, где каждое значение написано с новой строки.
            Кроме словаря «модели автомобилей». Там использован иерархический xml, чтобы было соответствие модели и марки.
            Словарь нужен для каждого текстового поля, числовые поля можно делать используя генератор случайных чисел.

            В общем, если есть желание — делайте словари и присылайте их мне.

  13. Интересное решение!
    А вот вопрос такой: как можно автоматом к уже имеющимся записям добавить по одной (несколько) картинке из определенного каталога?

    • kashinas

      В рамках данного скрипта — никак.
      Можете написать свой скрипт: извлекаете запись из БД, редактируете и записываете обратно.
      Или же можно написать плагин, который вставляет картинки в запись на автомате. А можно взять готовый: Auto Post Images (API)

  14. Спасибо! Добавил сервис в закладки!

  15. Скрипт супер, но в сапу уже сайты не принемают с таким контентом. У меня 2 сайта не приняли. Хороший дизайн, удобное меню, но сказали что контент генерированный.

    • kashinas

      Да, в сапе иногда отказывают в последнее время. Можно попробовать лучше маскировать сайт, например добавив пару страниц с новостями на главную.

  16. фотографии не соответствуют объявлению, это у всех так или я чтото не так делаю?

    • kashinas

      Конечно не соответствует, это же генератор контента, а не искусственный интеллект 😀
      Более того не соответствуют характеристики и рыночные цены.
      Основная цель скрипта — просто создание множества уникальных страниц.

      • ясно, в любом случае спасибо за скрипт 🙂

        • kashinas

          Пожалуйста! Хорошего вам индекса и профита 😉

  17. Весьма не плохо, завтра попробую создать сайт на вашей генерации. Большое спасибо!

    • kashinas

      Не за что, успехов в монетизации. Если напишите через месецок о результатах, то огромный респект!

  18. Приветствую. Отлично проделанная работа. Сервис имеет хороший потенциал, главное не ленится и продолжать работать! Есть некоторые параметры, которые я бы хотел изменить, не могли бы Вы поделится данным скриптом?

  19. Ярсолав

    НЕ знаю…у меня постоянно пишет 504 Gateway Time-out, не понятно почему?!..Автор можно вашу аську?пообщаться по этому поводу?

    • kashinas

      Скрипт работает корректно. Сгенерировано уже почти пол миллиона страниц, ни у кого таких проблем не было. Попробуйте обновить браузер. Контактные данные тут http://kashinas.ru/contacts/

  20. Ivan

    Привет, я нуб совсем, но пытаюсь разобраться. Подскажите полный путь куда картинки залить.
    P.S. сильно тапками не кидайтесь.

    • kashinas

      В папку «images» в корне сайта

      • Ivan

        Спасибо, получилось, сразу не дошло скопировать папку целиком в корень.

  21. Та же история, что и с Ярославом. Постоянно выдает «504 Gateway Time-out» во фрейме.

    • kashinas

      Тот же ответ, что и Ярославу. Скрипт работает корректно. Сгенерировано уже почти миллион страниц, ни у кого таких проблем не было. Попробуйте обновить браузер.

      • Браузер тут не при чем. Я уже разобрался. Все работает хорошо, если генерировать меньше 200 страниц.
        Спасибо большое вам за отличный сервис. Добавил в закладки.

  22. Serj

    Здравствуйте! Объясните, пожалуйста, контент рабочий или как антураж для сайта? Объявления натуральные? Если «да», то после сделки, оно должно исчезнуть, чтобы не морочить голову другим. Спасибо!

    • kashinas

      Здравствуйте. Естественно, это нереальные объявления и не могут ими быть. Это генерируемый контент для наполнения сайта.

  23. Спасибо за скрипт! Самодостаточный,отлично работает и сайты хорошо индексируются. Только бы подольше работал…javascript:grin(‘:wink:’)

  24. Здравствуйте! Заметил такой баг у скрипта: иногда, при генерации контента, точнее картинок, появляется очень тяжелый по размеру файл, bcb8066a2b6ec8996b4c49fd2ca2c2be.jpeg (6,88 Мб). Это происходит не всегда, но случается. Может быть он даже не один. На сервер через ftp закачивать в этом случае проблематично в виду ограничения размеров файлов. Я приноровился вычленять этот файл из папок с картинками, хотя не очень удобно. Может кому то пригодится мое замечание. А исправить, так совсем было бы хорошо 😉

    • kashinas

      Спасибо. Исправил.

  25. Вся генерация = сплошь объявления о продаже авто :))))) :mrgreen: НАВОДНЯЕМ интернет тупыми объявами о продажах тачек. Че сказать — КРУТО ❓

    • Steeep

      КОТ не совсем прав, мы наводняем интернет такими сайтами, но эти же сайты кому то приносят пользу в продвижении своих, может быть даже ХОРОШИХ, БЕЛЫХ и ПУШИСТЫХ сайтов. И это не адалт, не фарма и прочее г…

  26. Steeep

    Все, накрылся медным тазом скрипт? Не генерирует ничего…

    • kashinas

      Да, скрипт больше не работает. Реанимировать его нет времени и желания, как никак почти 8 лет скрипт был в бесплатном доступе, я на нем ни заработал ни копейки (имеется виду продаже скрипта или услуг по генерации). За все время его использования сгенерировано 1 729 303 страниц (стоит ограничение не более 500 страниц за раз).