среда, 2 июня 2010 г.

О копипасте

Из людей, пытающихся зарабатывать на сапе, наверное только самый упоротый не понял, что путь к большим доходам лежит по дороге из желтого кирпича многостраничных сайтов от 1000 страниц. Понятно, что если покупать копирайтинг и рерайт на адвего, то можно остаться без штанов, так что на помощь манимейкеру приходит копипаста.



Конечно, копипаста-копипастой, но процесс хочется хотя бы как-то автоматизировать, не сидеть же руками как обезьянка в самом деле. Кто-то пишет RSS-грабберы, но тут такой ньюанс, что это самый легкодоступный источник контента, на который все обращают внимание с самого начала, так что поисковые системы сразу к таким сайтам относятся с некоторым сомнением, так как он растиражирован по самое нихачу.

Самый интересный контент - это такой контент, который недоступен через RSS (т.е. недоступен ленивым конкурентам), а в идеале недоступен поисковикам вообще (вроде социалок типа вконтакте). К социалкам я отношусь не_очень, так что целюсь в контент который лежит в открытых местах для поисковиков местах, но хороший (не растащен на кучу сателлитов и хорошо структурирован).

Многие люди помнят бум vipbabla - когда люди предложили за смешную цену парсеры всего подряд для людей толком не умеющих даже задать шаблоны для парсинга.

Их первый скрипт (генератор сателлитов) был с первого взгляда божественным - даёшь ему слово-тематику сайта, выбираешь шаблон, жмёшь кнопку - он генерит сателлит. Ключи парсит из вордстата, по ним находит в выдаче статьи, их автоматом копипастит удаляя лишний мусор, делает перелинкованный случайным образом каталог статей, в некоторые статьи втыкает картинки, спарсенные из яндекс.картинки, текст уникализирует: синонимайзерит и умеет перегонять на английский туда-обратно. Было как сказка, тут не 100 сайтов в день, как учил Сеоштейн, а сотни, тысячи. В индекс они по большей части попадали, но выпадали быстрее, чем на них успевал подняться тиц и продаться первые ссылки.

Их второй скрипт (webgrabber) - был поумнее, более конфигурируемый, ему указываешь сайт - он с него парсит статьи. Сам находит статьи на сайте, сам вырезает лишние теги, довольно симпатично. Много контента набрать реально, конечно есть косяки - он тег #a# вырезает не очень умно, вместе с анкором, так что если кто-то в статье делает ссылкой значимое по смыслу слово - предложение становится оборванным. Разбивка на абзацы теряется - но простеньким php скриптом разбить текст на абзацы случайным образом разве что новичок манимейкинга не сможет. Сайт, сделанный на копипасте каталогов статей из 3-4 источников + какая-нибудь плюшка типа небольшая фото-галерея или форум парсенный из вконтакте держался ощутимо лучше, чем сателлит, созданный первым скриптом (и уж гораздо лучше сателлита на вордпрессе, который тупо награбил несколько RSS каналов), но тоже долговечным назвать его - язык не поворачивается.

(Разумеется оба скрипта от випбабла давно есть в паблике, занулёные, ссылки давать не буду, если кому интересно - сами найдёте)

Но нам хочется идти к успеху и дальше, чтобы АГС не трогал, сайты жили условно вечно и не надо было тратить большие деньги на копирайтинг.

Мне кажется (а моё "кажется" опирается на некоторый опыт), что для успеха копипасты должны (не обязаны конечно, но с ними веселее) выполняться 4 пункта:
  1. Для парсинга должно быть выбрано более 3 источников. Причём хороших источников, структурированных, и информация из них должна перемешиваться. Т.е. парсим мы например доску объявлений про автомобили, если объявления берутся из одного места, то технические характеристики автомобилей - из другого, и там очерёдность отображения полей "объём двигателя", "потребление бензина" должны быть перетусована.
  2. Структура нашего сателлита должна отличаться от структуры сайта, с которого вы копипастим и желательно не быть блоговой. Т.е. стандартная схема: страницы, на которых размещены анонсы наших статей, снизу пагинатор и полные статьи - она несколько тянет на дно. В идеале следует придумать несколько видов материалов, дополнительные поля для разных видов материалов, в эти дополнительные поля собирать нужную информацию, для разных типов материала различные шаблоны отображения. Кстати, если для каких-то данных мы можем легко придумать дополнительные поля, но их истинное значение для товара нам неизвестно: ничто не мешает нам использовать размножающийся шаблон в этом месте, типа "Вес ноутбука:{2|3|4}.{1|2|3|4|5|6|7|8|9} кг" или "Ноутбук *название ноутбука* {{идеально|оптимально} подходит|{лучшее|надёжное} решение|{хороший|правильный} выбор|просто создан} для {компьютерных игр|развлечения|мультимедийный задач} и {офиса|работы}". Такие размножающиеся шаблоны помогают.
  3. Наш сателлит должен предоставлять/имитировать некий полезный сервис (в широком смысле этого слова). То есть отвечать/делать вид, что отвечает запросу человека, пришедшего на сателлит, и быть не просто ужасной отсканированной статьёй по строительству/экономике из книжки, которая потеряла актуальность лет 30 назад, а быть актуальной подборкой информации по теме из разных источников. В этом плане в очень выгодном свете предстают интернет-магазины для небольших городов (да и не только). Парсим базу товаров откуда-нибудь, где отдельно заданы атрибуты, создаём мелочёвку вроде поиска по одинаковым значениям параметров, поиск по параметрам, лежащих в диапазоне (на каждый такой поиск - отдельная страничка, хе-хе), цены умножаем на (0.9+(rand()%20)/100), немного рандомим с наличием товара на складе, подставляем в название магазина всюду небольшой город и - Яндекс редко такое банит, думая что предоставляет пользователям из этого города ценную информацию.
  4. Сателлит должен изменяться по времени. В идеале - появление новых страниц. Можно каждый день/неделю чуток перетряхивать цены и немного менять наличие товара на складе, или публиковать новые объекты/товары/статьи с задержкой. Это можно и нужно автоматизировать. Главное не быть статичным, ибо реальные магазины, которые не обновляются по несколько месяцев, вызывают у поисковых систем оправданные сомнения, а мы хотим жить вечно.
Вот как-то так.

Вопросы, уточнения?

Или может в комментариях появится умный человек и расскажет как обстоят дела на самом деле?

.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.

Кстати, из людей, взявших в своё время скрипт для
наполнения киносайтов через адвего - расскажите о своих успехах, времени прошло немало. Бесплатно сошлюсь (а я когда-то брал деньги за то что я ссылаюсь? :) ) на ваши посты, если вы ведёте блоги.

.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.

В прошлом посте упомянул книгу Хфактора о заработке на MFA. BackSpark эту книгу уже как несколько недель переводит. Сейчас она на 1/3 где-то готова. Вот посты из нее http://backspark.net/category/kurs-po-adsense. Я считаю, что полезно.

.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.oOo.

Почитаешь, что
творится в Беларуси - и понимаешь, что в "Сираной Рашке" не так уж и плохо :)

26 комментариев:

  1. Анонимный2 июня 2010 г., 22:05

    Только еще куча мелочей осталась за рамками статьи, без которых все эти "финты ушами" ничего не значат. Полный копипаст для новых сайтов - мертв, даже вперемешку, в том числе и с ссылкой на первоисточник. Единственное что продержалось месяц - генерация "типа под дор" 3 предложения от одного источника + пара от другого = абзац. Вот генерация доп. полей для разбавления контента из характеристик еще работает. В индексе держится уже месяца 3 (с сапой), но тут нужно знать программирование или иметь готовый инструмент. Кроме того не затронуты такие нюансы как: ссылочное (входящее/исходящее) если говорим о долгоиграющих сайтах под сапу, внутренние дубли, и т. п.
    А вобще в правильном направлении мыслите :)
    Это как в мире животных: не можешь сесть - притворись кем-то, кого лучше не трогать или чем-то на что не стоит обращать внимание.

    ОтветитьУдалить
  2. Анонимный2 июня 2010 г., 22:19

    По предыдущему посту я было подумал, что Усатый больше не будет писать.

    Спасибо, что пишешь. Пишешь всегда по делу, приятно читать.

    ОтветитьУдалить
  3. Анонимный2 июня 2010 г., 22:21

    Кстати, наверно стоит где-нибудь пустить рекламу, что "Усатый вернулся", а то те, кто отписался об этом не знают =). Например перед апом выдачи, купить ссылку на pr-cy.ru.

    ОтветитьУдалить
  4. Анонимный2 июня 2010 г., 22:58

    Поправьте, пожалуйста, - "творится в БелАруси"

    ОтветитьУдалить
  5. vipbabla, крутая штука, не знал об этом. Конечно такие сайты не будут жить, но очень впечатляет.

    ОтветитьУдалить
  6. такому сайту нужна постоянная поддержка, я то думал ты напишешь что нибудь такое, саморазвивающийся проект....

    ОтветитьУдалить
  7. Анонимный3 июня 2010 г., 1:11

    тащемта "творится в Беларуси" аналогично замене Молдавии на Молдову и тп.
    это в РБ пишется Беларусь, в РФ нет.
    Извините, надоело.

    ОтветитьУдалить
  8. Анонимный3 июня 2010 г., 11:07

    Полный копипаст еще не мертв :) Сильно зависит от тематики, как оказалось. У меня есть сайт из очень узкотематичной ниши ~1500 страниц, ни одной уникальной :) Сидит в сапе уже с полгода, все отлично

    ОтветитьУдалить
  9. Хмм... непонятно зачем клепать сотни ГС, когда и так понятно что они и так в индексе долго не проживут? Лучше делать нормальные сайты. Медленно, зато со временем отдачи будет больше. Я иду таким путем. Раньше тоже делал гс пачками, но они давно все в бане. Овчинка выделенки не стоит.

    ОтветитьУдалить
  10. > Только еще куча мелочей осталась за рамками статьи, без которых все эти "финты ушами" ничего не значат.

    Ну что-то мне показалось слишком очевидным, чтобы писать об этом, чего-то я не знаю. Я веду свой блог в основном не для новичков в манимейкинге, а для людей, умеющих думать головой и читать между строк, додумывая мысли. Если бы я писал посты объясняющие стандартные аббревиатуры, паля паблик фильтры по тиц - меня бы читало больше людей, но я ещё не настолько уныл, как я надеюсь.

    > По предыдущему посту я было подумал, что Усатый больше не будет писать.

    Я с усами играю в камень-ножницы-бумага. Кто проиграл - тот пишет пост.

    > Хмм... непонятно зачем клепать сотни ГС, когда и так понятно что они и так в индексе долго не проживут? Лучше делать нормальные сайты. Медленно, зато со временем отдачи будет больше. Я иду таким путем. Раньше тоже делал гс пачками, но они давно все в бане. Овчинка выделенки не стоит.

    Я рад за вас, осталось только пожелать читать посты не по диагонали.

    > такому сайту нужна постоянная поддержка, я то думал ты напишешь что нибудь такое, саморазвивающийся проект....

    Нет. Достаточно написать хорошие скрипты и они всё будут делать сами.

    > Кстати, наверно стоит где-нибудь пустить рекламу, что "Усатый вернулся", а то те, кто отписался об этом не знают =). Например перед апом выдачи, купить ссылку на pr-cy.ru.

    Я что, похож на человека, который будет тратить деньги на продвижение блога? Неееет, весь интерес в том, что всё делается бесплатно, без покупок постовых и тому подобного. Мне было бы неинтересно, если бы я купил постовые на топовых блогах, выкупал рекламу на порталах - я не настолько уныл.

    ОтветитьУдалить
  11. Лучше делать нормальные сайты для людей и себе будет больше денег с них и людям польза, так сказать вклад в интернет.

    ОтветитьУдалить
  12. > Лучше делать нормальные сайты для людей и себе будет больше денег с них и людям польза, так сказать вклад в интернет.

    Лучше быть богатым и здоровым, чем бедным и больным.

    ОтветитьУдалить
  13. Я щас себе пишу дорген по буржуев и тоже много думал по поводу уникальности текста.
    Во первых будет напонятся ваш сайт или нет это не важно. Я не думаю что сайт просто обязан быть динамичным. Как же персональные странички, личные двустраничные фото альбомы и т. д. То есть примеров куча есть.

    Дальше я думаю что для анализа уникальности текста гуглу нужно минимальное количество текста на странице. То есть если мы возьмём по предложению с разных источников.
    То текст будет уникальный и тематический.
    А яндекса в пизду он и сайты наполненые руками выкидывает из индекса как нех делать.
    У гугла трафа море, клики за кеи дорогие, работай не хочу.

    ОтветитьУдалить
  14. Анонимный3 июня 2010 г., 22:27

    На самом деле, не стоит даже себе голову забивать всем, что написано :). Ссылочное имеет огромную роль. Будет нормальное ссылочное, даже самое унылое говно просидит в индексе 3-6 месяцев, а то и больше. Грубо говоря, можешь сделать хоть 1000 сателлитов на одних и тех же статьях (главное, чтобы сайты имели разную структуру), но с нормальным ссылочным они будут очень хорошо в индексе сидеть. И кстати, то же и к дорам относится. Сейчас делаю все доры строго на копипасте. Никакого говна типа Маркова. Доры с плохим ссылочным лезут в индекс туго. Доры же с нормальным - влетают, как пушечное ядро! Не верите? Сделайте говносайт с более-менее нормальным дизайном и начните его прокачивать качественными ссылками (не говном с MFS, качество здесь прежде всего). А затем сравните его с такими же сайтами, но без нормального ссылочного.

    ОтветитьУдалить
  15. > Сделайте говносайт с более-менее нормальным дизайном и начните его прокачивать качественными ссылками (не говном с MFS, качество здесь прежде всего).

    Вы поднимаете тиц сателлитам для сапы с помощью качественных ссылок? Можно поподробнее, как это у вас получается и что вы имеете ввиду под "качественными ссылками".

    ОтветитьУдалить
  16. Я делал киношные сайты на скрипте адвего. Пока результатом не очень доволен, плохо яндекс индексирует его. Надо еще экспериментировать.

    ОтветитьУдалить
  17. Анонимный4 июня 2010 г., 2:30

    Усатый, стоит ли сочетать сапу и адсенс на одном сайте?

    ОтветитьУдалить
  18. Копипаста может и продержится, если ее правильно приготовить. Но судя по моему небольшому опыту, из Яндекса на ура вылетают не только копипастные, а вроде как и уникальные сайты - причем алгоритм понять затруднительно. Единственно, в чем уверен - сайт должен имитировать жизнь, т.е. обновлятся, и иметь по возможности нестандартный движок. Хотя и WP есть живые вполне себе сайты. Я вот больше смотрю в сторону автогенерирующегося контента. Вот например написал скрипт, который генерирует типа объявления, такая имитация доски объявлений - ниче, 3й месяц в индексе живет. Можно без особого напряжения таким же образом мимикрировать, например, под портал о работе, либо под магазин по продаже какой-нибудь байды. Преимущества - не надо искать источники для копипаста и зависеть от них, подстраивать парсер в случае изменения в источнике.
    У меня лично ситуация достаточно парадоксальная сложилась. Почти все сплоги на WP с уникальным контентом, хотя и сделанные для сапы, но тем не менее вполне себе с нормальным читаемым контентом - полетели под АГС (где то процентов 20 выжило). А вот автосгенеренные сайты, нагло прикидывающиеся магазинами и досками объявлений и абсолютно для людей бесполезные - живут, цветут и пахнут. Яндекс - это бред, конечно.
    Проблема в другом - как быстро и дешево нагнать ТИЦ (ну это проблема вечная).

    ОтветитьУдалить
  19. > Усатый, стоит ли сочетать сапу и адсенс на одном сайте?

    Тут понимаешь в чём ньюанс, по данным адсенса можно всю сетку вычислить за 5 секунд, а это неприятно. Можно конечно как я - использовать 4 разных аккаунта в адсенс, но всему есть свой предел. С точки зрения получения дохода - использовать сапу и адсенс хорошо, с точки зрения "безпалевности" - сомневаюсь. Я бы не стал использовать адсенс на куче копипастных сателлитов. В Бегуне нет денег, а в Яндекс.Директ врядли возьмут :) Ну если тематика коммерческая и посещалка выросла - можно ставить на те и только те сателлиты адсенс.

    > Но судя по моему небольшому опыту, из Яндекса на ура вылетают не только копипастные, а вроде как и уникальные сайты - причем алгоритм понять затруднительно.

    Копипастность контента - лишь один из параметров сайта, и этого не "необходимое и достаточное" условие для бана сайта.

    > Почти все сплоги на WP с уникальным контентом, хотя и сделанные для сапы, но тем не менее вполне себе с нормальным читаемым контентом - полетели под АГС (где то процентов 20 выжило). А вот автосгенеренные сайты, нагло прикидывающиеся магазинами и досками объявлений и абсолютно для людей бесполезные - живут, цветут и пахнут. Яндекс - это бред, конечно.

    Почему это бред? Имхо очень разумно как раз.

    > Проблема в другом - как быстро и дешево нагнать ТИЦ (ну это проблема вечная).

    Да ладно?

    ОтветитьУдалить
  20. http://molchun.ru/ - всем доказательство, пару лет как, что копипаст жив. и при грамотной варке и жарке, лежит и входит в индекс крепко. отсюда, что, ссылки и время, и пох какой контент :)

    фейкшопы по теме, по магазинам, плюх очень много можно подобрать. наличие на складе {нет|есть}, доставка {авиа|fedex|DHL|почта россии}, вообщем очень много раздолья для воображения.

    debelov, а можешь, по-подробнее рассказать, про Таиланд, как снимал хату, чо почём там? спасибо :)

    ОтветитьУдалить
  21. Есть у меня один сайт. Наполняется сам уже 9 месяцев. Использую простой грабер для WP. Пока проблем нет. КОличество страниц в яндексе скоро приблизится к 8000. Трафик маленький. Сайт не раскручивал, никуда не добавлял. Некогда, если честно. Потом посмотрю, что с ним делать.

    ОтветитьУдалить
  22. Анонимный8 июня 2010 г., 15:08

    нужно сделать сайт страниц 10-15-20. С хорошим контентом о какой-нибудь компании. Как отлежится годик, туда нагоняешь копипаст и всё индексируется всё работает как надо. Даже без всяких там ТИЦ, прогонов по социалкам и т.п. А если делать такое http://calefactio.info (не мой сайт, я его в ГБЛ занёс), то ясное дело долго не проживёт.

    ОтветитьУдалить
  23. Анонимный8 июня 2010 г., 15:21

    > нужно сделать сайт страниц 10-15-20. С хорошим контентом о какой-нибудь компании. Как отлежится годик, туда нагоняешь копипаст и всё индексируется всё работает как надо. Даже без всяких там ТИЦ, прогонов по социалкам и т.п. А если делать такое http://calefactio.info (не мой сайт, я его в ГБЛ занёс), то ясное дело долго не проживёт.

    Метод работает. Убедился сам в этом.

    ОтветитьУдалить
  24. "Понятно, что если покупать копирайтинг и рерайт на адвего, то можно остаться без штанов, так что на помощь манимейкеру приходит копипаста." - улыбнуло.
    Есть куча бирж, где цены на порядок выше.

    ОтветитьУдалить
  25. Давно не обращался к этой части ИНЕТА. Почитал и ужаснулся. Сколько умных людей занимаются фигней. С такими мозгами можно сделать много пользы ЛЮДЯМ. Посмотрите это.
    1.http://rutube.ru/tracks/1431526.html?v=3f7810b57ad9c1f2574cd016fa3d69a4
    2. http://www.youtube.com/watch?v=H32RQXQwbsw
    73!

    ОтветитьУдалить
  26. http://mishki-store.ru/
    Интернет-магазин по продаже плюшевых медведей с доставкой по всей России по самым низким ценам. Наша цель - доставлять вам и вашим близким только самые положительные эмоции!!!

    ОтветитьУдалить