لنبدأ على الفور برمز البرنامج النصي الرئيسي:
#!/usr/bin/Perl
# البرنامج النصي الذي-forum.pl
# (ج) 2010 ألكسندر أليكسيف، http://site/
استخدام صارم؛
# سطور معلقة - من أجل الدقة
# إذا كانت المهمة هي جمع إحصائيات المحرك، فاتركها كما هي
# إذا قمت بإنشاء قائمة المنتديات - قم بإلغاء التعليق
بياناتي $؛
بيانات $ .= $_while (<>
)
;
# تحقق من مقدار الدعم الذي تم تشغيله بواسطة phpBB بدون الرابط الموجود في التذييل ستجد هذا البرنامج النصي وغيره من البرامج النصية المذكورة في المنشور في هذا الأرشيف. البرنامج النصي الذي-forum.plيقوم بفحص كود صفحة HTML لمعرفة ما إذا كان يحتوي على توقيعات محرك المنتدى. لقد استخدمنا تقنية مماثلة عند تعريف WordPress وJoomla، ولكن هناك بعض الاختلافات. أولاً، لا يقوم البرنامج النصي نفسه بتحميل رمز الصفحة، ولكنه يقرأه من stdin أو من ملف تم تمريره كوسيطة. يتيح لك ذلك تنزيل الصفحة مرة واحدة، على سبيل المثال، باستخدام wget، ثم تشغيلها من خلال عدة محللين، إذا كان لدينا أكثر من واحد. ثانيا، في هذا البرنامج النصي وجود التوقيع هو 100٪ علامة على المحرك. في المرة الأخيرة، أدى وجود التوقيع إلى إضافة وزن للمحرك المقابل، و"فاز" المحرك ذو الوزن الأكبر. قررت أنه في هذه الحالة، فإن مثل هذا النهج لن يؤدي إلا إلى تعقيد التعليمات البرمجية دون داع. لاختبار النص، قمت ببعض الأبحاث. قمت بتجميع قائمة تضم عدة آلاف من المنتديات وقمت بتشغيل كل منها من خلال البرنامج النصي الخاص بي، وبالتالي تحديد النسبة المئوية لاستجابات البرنامج وشعبية المحركات المختلفة. للحصول على قائمة المنتديات، استخدمت محلل Google الخاص بي. تم إرسال استعلامات مثل هذه إلى محرك البحث الموقع:forum.*.ru وهكذا. ستجد رمز مولد الاستعلام الكامل في الملف الجنرال-forumsearch-urls.pl. بالإضافة إلى Zone.ru، تم استخدام .su .ua .kz و .by أيضًا. في المرة الأخيرة، كان من الصعب إجراء مثل هذه الدراسة، لأن مواقع WordPress وJoomla لا تحتوي على مثل هذه التوقيعات في عنوان URL. لا توفر الكتالوجات مثل cmsmagazine.ru/catalogue/ حجمًا كافيًا للعينة. ما هو 600 موقع دروبال؟ يجب أن أعترف أن نتائج التجربة خيبت أملي. ومن بين 12590 موقعًا تمت دراستها، تم التعرف على المحرك بنجاح في 7083 موقعًا فقط، أي في 56% فقط من الحالات. ربما لم آخذ بعين الاعتبار بعض المحركات؟ هل كان صحيحًا أن نصف المنتديات تم تثبيت Bitrix عليها؟ أم هل كان يجب أن أقضي المزيد من الوقت في البحث عن التوقيعات؟ بشكل عام، مطلوب بحث إضافي هنا. من بين 56% من المحركات التي تم تحديدها بنجاح، الأكثر شهرة، كما هو متوقع، كانت IPB (31%)، phpBB (26.6%) وvBulletin (26.5%). ويتبعهم بفارق كبير SMF (5.8%) وDLForum (5.3%). كانت لعبة punBB المفضلة لدي في المركز السادس فقط (1.64%). لا أنصح بوضع الكثير من الثقة في هذه الأرقام (يقولون إن كل منتدى ثالث على RuNet يعمل على IPB)، ولكن يمكن، بالطبع، استخلاص بعض الاستنتاجات. على سبيل المثال، إذا كنت تنوي إنشاء موقع على محرك المنتدى وتخطط لتعديل المنتدى، على سبيل المثال، دفع 0.01 دولار للمستخدمين لكل رسالة مع السحب التلقائي للأموال مرة واحدة في الأسبوع، فيجب عليك اختيار أحد المحركات الثلاثة الأكثر شيوعًا. كلما زادت شعبية المنتدى، زادت فرص العثور على مبرمج على دراية جيدة به. إذا لم تكن هناك تغييرات كبيرة متوقعة في المحرك، فقد يكون من المنطقي اختيار محرك أقل شعبية، على سبيل المثال SMF أو punBB. سيؤدي هذا إلى تقليل عدد هجمات المتسللين على منتداك وكمية البريد العشوائي المرسلة إليه تلقائيًا. يمكن أيضًا أن تجد البرامج النصية للبحث/تحديد المنتديات العديد من التطبيقات العملية. أول ما تبادر إلى ذهني هو تصنيف المنتديات المحددة حسب TIC ونشرها في أول مائة مشاركة مع روابط إلى أحد مواقعي. ومع ذلك، فإن المئات من روابط المنتدى dofollow لم تؤثر على TCI بأي شكل من الأشكال (لقد مر تحديثان)، لذلك من الأفضل عدم إضاعة الوقت هنا، إلا إذا لم تكن مهتمًا بالانتقالات. من الواضح أن الاستخدام المذكور للنصوص البرمجية ليس هو الاستخدام الوحيد. أعتقد أنه يمكنك بسهولة معرفة كيف يمكنك استخدامها. تم تنظيمه بواسطة Botmaster Labs، ولم يتم التخطيط له. ليس لدي وقت، الفيديو ضروري للمنافسة، باعتباره اتجاهًا جديدًا، على الرغم من أنه يمكن شرح كل شيء بسهولة أكبر باستخدام لقطات شاشة جيدة (IMHO الخاص بي)، ولا أريد حقًا تصوير أي شيء. لم يتبق سوى عدد قليل جدًا من المواضيع المربحة، ولم يعد البريد العشوائي الغبي يحكم على الإطلاق، عليك أن تفكر هنا ولن يقوم أحد بتصوير المواضيع، إلا إذا حاولت وضع المواضيع القديمة في غلاف جميل ومسحها قليلاً. :) ولكن هذا لا يتعلق بنا. بشكل عام، أعتقد أن هذه الأشياء الثلاثة المحظورة أصبحت في الأساس حواجز أمام المشاركة في المنافسة بالنسبة لغالبية المشاركين المحتملين. إنه مثل إصلاح سيارة من أصل ثلاثة: رخيصة وعالية الجودة وسريعة - يمكن للخدمة تلبية شرطين فقط في نفس الوقت. اجلس واختر ما هو أقرب إليك. :) نفس الشيء بالنسبة للمسابقة: عندي وقت، أعرف كيف أصنع فيديو، لكن ليس هناك موضوع، أو أعرف كيف أصنع فيديو، هناك موضوع، لكن ليس لدي الوقت في كل شيء أو لدي بعض وقت الفراغ وهناك موضوع صغير ولكن الفيديو مخيف. لكن هذا أمر جيد إذا تم استيفاء شرطين في نفس الوقت. حسنًا، حسنًا، دعنا نتجاهل الكلمات. سأستمر بنفسي. لم أخطط، مما يعني أنني شاركت في المسابقة، حتى أنني اخترت المقال الذي سأصوت له. مهما قلت، فإن Doz يعرف البرنامج جيدًا ويعرف كيفية استخدامه بذكاء شديد. لكنني علمت اليوم أن المؤامرات ظهرت في المنافسة. اتضح أنني لن أتمكن من التصويت، ولن يتمكن من القيام بذلك سوى الوافدين الجدد الذين اشتروا البرنامج في عام 2011، والمنافسة مصممة لهم. لقد فوجئت قليلاً، ولكن المالك رجل نبيل. المنافسة عبارة عن حملة إعلانية وألكسندر يعرف بشكل أفضل كيفية تنفيذها. بشكل عام، قررت بعد ذلك نشر مقال، من الأسهل إلى حد ما أن أكتب عندما يكون من الواضح لمن، في المزرعة الجماعية بأكملها، من المستحيل القيام بذلك. مدعوم من PHP-Fusion في نسخة Khroomer 7.07 تم تدريب البرنامج على عدة محركات جديدة: forums.biz، forumb.biz، 1forum.biz، 7forum.biz، إلخ. phpBB-fr.com، موضوع سولاريس phpBB وعملية تعلم أشياء جديدة مستمرة. "مدعوم من SMF 1.1.2" "مدعوم من SMF 1.1.3" "مدعوم من SMF 1.1 RC2" "مدعوم من SMF 1.1.4" "مدعوم من SMF 1.1.8" "مدعوم من SMF 1.1.7" "2006-2008، شركة Simple Machines LLC" وهذا ليس كل شيء. أثناء جمع إصدارات المحرك، نجد في بعض منتديات SMF التسمية التوضيحية "2001-2006، Lewis Media" في التذييل. نحن نتحقق من هذا الطلب، وهو أيضًا يرضينا تمامًا. نجد طلبًا مشابهًا: "2001-2005، لويس ميديا". وبالنظر إلى التذييلات بشكل أكبر نجد الطلب التالي: "تصميم SMFone بواسطة A.M.A، تم نقله إلى SMF 1.1". نتحقق - عظيم. وهكذا. نصف ساعة من العمل ولديك قاعدة بيانات رائعة لاستعلامات المحرك، وسوف تحظرك Google على هذه الاستعلامات في كثير من الأحيان أقل بكثير مما لو كنت تستخدم عوامل تشغيل فيها. وفي الوقت نفسه، ستكون قاعدة البيانات الخاصة بك أكثر نظافة مما لو كنت تستخدم استعلامات مثل "index.php?topic="، لأن Google هنا لن توفر فقط المنتديات التي نحتاجها، ولكن أيضًا العديد من الموارد اليسارية حيثما كان ذلك ممكنًا اترك رابطًا لموضوع المنتدى. ربما تعترض، ما المشكلة في ذلك؟ آخرون تركوا الرابط، حتى نتمكن من ذلك أيضا. لكن! يمكن ترك الروابط ليس فقط عن طريق Khrumer، ولكن أيضًا عن طريق البرامج الأخرى. علاوة على ذلك، يمكن تصميمها خصيصًا لترك التعليقات على مصدر معين، وهو ما يسمى بالبرامج المتخصصة للغاية، بالإضافة إلى إمكانية ترك هذه الروابط يدويًا. مرة أخرى، أكرر، ليست كمية القمامة هي المهمة بالنسبة لنا، بل الجودة؛ سنقوم بجمع قاعدة البيانات بالطلبات الصحيحة. ميزة هذه الطريقة هي أنك لن تحتاج عمليا إلى التهيئة غربال - مرشح
伟哥 - الفياجرا 吉他 - الغيتار 其他 - الراحة 保险公司 - التأمين ضع رموز الاستبدال هذه في ملف الكلمات: %E4%BC%9F%E5%93%A5 %E5%90%89%E4%BB%96 %E5%85%B6%E4%BB%96 %E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8 إذا كنت تروج لموقع تأمين، فمن خلال وضع رابط في ملفك الشخصي على منتدى موضوعي (!) حتى صيني يتم العثور عليه عند الطلب " منتدى SMF" 保险公司سيكون جيدًا جدًا.
طباعة "phpbb \n"
إذا ($ البيانات =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/؟"[^>]*>phpBB/iأو
# $data =~ /viewforum\.php\?[^""]*f=\d+/i أو
$data =~ /phpBB\-SEO/i أو
بيانات $=~ /)
;
طباعة "إب \n"
إذا ($ البيانات =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i
أو
بيانات $=~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/؟"[^>]*>Invision Power Board/iأو
بيانات $=~ /
بيانات $=~ /index\.php\?[^""]*showforum=\d+/i)
;
طباعة "نشرة \n"
إذا ($ البيانات =~ / مدعوم من:؟[^<]+vBulletin[^<]+(?:Version)?/i
أو
بيانات $=~ /)
;
طباعة "سمف \n"
إذا ($ البيانات =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/؟"[^>]*> مدعوم من SMF/iأو
بيانات $=~ /index\.php\?[^""]*board=\d+\.0/i)
;
طباعة "punbb \n"
إذا ($ البيانات =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/؟"[^>]*> بون بي بي/i) ;
#أو
# $data =~ /viewforum\.php\?[^""]*id=\d+/i); \n"
طباعة "fluxbb
# if($data =~ /viewtopic\.php\?id=\d+/i أو /إذا ($data =~)
;
]+href="http:\/\/(?:www\.)fluxbb\.org\/؟"[^>]*>FluxBB/i \n"
إذا ($ البيانات =~ /طباعة "exbb]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/؟"[^>]*>ExBB/i
) ;
# أو \n"
إذا ($ البيانات =~ /# $data =~ /forums\.php\?[^""]*forum=\d+/i);أو
طباعة "ياب
]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/؟"[^>]*>YaBB/i \n"
إذا ($ البيانات =~ $data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;<\/title>/أناأو
بيانات $=~ /طباعة "دلفوروم<\/a>/أنا)
;
/\(بدعم من منتدى DLE\) \n"
إذا ($ البيانات =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=copyright)[^"]*">منتدى DLEأو
بيانات $=~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/i \n"
إذا ($ البيانات =~ /]*>ExBB/i
$data =~ /ikonboard\.cgi/i ) ;
طباعة "بببريس
# $data =~ /topic\.php\?id=\d+/i أو \n"
# $data =~ /forum\.php\?id=\d+/i);
طباعة "flashbb
إذا ($ البيانات =~ /# if($data =~ /forums\.php\?fid=\d+/i أو)
;
# $data =~ /topic\.php\?fid=\d+/i أو \n"
]+href="http:\/\/(?:www\.)?flashbb\.net\/؟"[^>]*>FlashBB/i
إذا ($ البيانات =~ /طباعة "ستوكسيت)
;
# if($data =~ /forum\.php\?f=\d+/i أو \n"
]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/؟"[^>]*>[^\/]*Stokes IT/i
إذا ($ البيانات =~ /طباعة "المنصة)
;
# if($data =~ /topic\.php\?t=\d+/i أو \n"
# if($data =~ /forum\.php\?id=\d+/i أو
إذا ($ البيانات =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/؟"[^>]*>UseBB/i)
;
طباعة "منتدى \n"
# if($data =~ /index\.php\?fid=\d+/i أو
إذا ($ البيانات =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/؟"[^>]*>WR\-Forum/i)
;
اطبع "Yetanotherforumnet \n"
إذا ($data =~ /Yet Another Forum\.net/i أو
بيانات $=~ /default\.aspx\?g=posts&t=\d+/i)
;
الموقع:talk.*.ru
الموقع:board.*.ru
الموقع:smf.*.ru
الموقع:phpbb.*.ru
....
انتهت المقدمة الطويلة، والآن إلى صلب الموضوع.
ما الذي يحتاجه المبتدئ عندما يشتري مثل هذا الجمع الفائق، وهو مجمع Xrumer + Hrefer؟ هذا صحيح، تعلم كيفية العمل على ذلك وتخلص من الوهم القائل بأنه يمكنك كسب المال عن طريق البدء في إرسال رسائل البريد العشوائي. إذا كنت تعتقد ذلك، فمن الأفضل التبرع بأموالك للجمعيات الخيرية على الفور. عليك أن تتعلم كيفية استخدام الأدوات المعقدة، ويفضل شحذها بنفسك. لقد انتهى زمن "خذ المزيد - ارمي أبعد". الكمية تفسح المجال للجودة. هذا يعني أننا سوف نقوم بتجميع قاعدة لأنفسنا؛ إذا لم تتعلم كيفية القيام بذلك، فسوف تتخلف عن القطار. وبطبيعة الحال، سوف يساعدنا خريفر في ذلك. إذا كنت تخطط للترويج لمواردك على Google، فسنحتاج أيضًا إلى البحث عن مواقع الجهات المانحة من خلال Google. أعتقد أن هذا أمر مفهوم ومنطقي. لكن جوجل، مثل سيدة جبل النحاس، لا تتخلى عن ثروتها للجميع. أنت بحاجة إلى نهج لذلك. أود أن أقول على الفور أنني لا آمل أنه بناءً على العلامات التي تجدها في الأماكن العامة، ستتمكن من جمع شيء ما. سبب توفرها للعامة هو أنها لا قيمة لها. لن أطور الموضوع أكثر. من الأفضل أن نخبرك بكيفية تجميعها بشكل صحيح حتى تتمكن من رؤية النتيجة، ويمكنك حل الباقي بنفسك، والشيء الرئيسي هو فهم المبدأ. نحن بحاجة إلى جمع العناصر الصحيحة بناءً على خصائص المحركات المحددة التي نحتاجها، وليس على خصائص المنتديات بشكل عام. هذا هو الخطأ الرئيسي للمبتدئين - عدم التركيز على شيء محدد، ولكن محاولة تغطية كل شيء في مجمله. وأيضًا، إذا كنت تريد تحليل قاعدة بيانات عادية إلى حد ما، فتوقف عن استخدام عوامل التشغيل في الاستعلامات. لا يوجد "inurl:"، "site:"، "title"، وما إلى ذلك. ستقوم Google بحظر الباحثين مثلك على الفور. ولذلك قمنا بدراسة المحركات التي يعمل عليها كرومر حالياً بعناية:
بشكل عام، نحتاج إلى إعداد الاستعلامات الصحيحة للتحليل بواسطة Hrefer. لنأخذ المنتدى dizhok كمثال. منتديات SMF. ودعنا نبدأ في تفكيكها إلى قطع غيار للتحليل. سيساعدنا Google المفضل لدينا في ذلك. أدخل استعلامًا في Google منتديات SMF- هناك الكثير من القمامة في نتائج البحث، نرجع إلى الصفحة الثالثة عشرة ونختار أي رابط. لقد صادفت هذا: http://www.volcanohost.com/forum/index.php?topic=11.0. دعونا نفتحه وندرسه. نحتاج إلى العثور على شيء مميز في الصفحة يمكن تطبيقه على البحث عن صفحات أخرى على هذا المحرك. في التذييل نلاحظ النقش التالي مدعوم من SMF 1.1.14واقتبسها وأدخلها في Google، يوضح لنا أنه بالنسبة لهذا الاستعلام يعرف حوالي 59 مليون خيار. نحن ننظر بسرعة من خلال الروابط، ونضيف بضعة خيارات أخرى لهذه الكلمة الرئيسية، على سبيل المثال، "مدعوم من SMF 1.1.14" حورأو "مدعوم من SMF 1.1.14" الفياجرا. نحن نتأكد من أن الطلب رائع، والنتائج هي منتديات فقط ولا تكاد تكون هناك أي قمامة.
بالإضافة إلى ذلك، نحن لسنا مهتمين بالكمية، بل بالجودة، كما قلت أعلاه. دعونا نمضي قدما. ومن نفس المنتدى نأخذ عبارة أخرى من التذييل: ، فنحن أيضًا نقتبسها ونرسلها إلى Google. ورداً على ذلك، كشف أنه يعرف أكثر من 13 مليون نتيجة. مرة أخرى، ننظر سريعًا إلى النتائج، ونضيف كلمات إضافية ونتحقق من النتائج باستخدامها. نتأكد من أن الطلب ممتاز وأنه لا يوجد أي نفايات تقريبًا. بشكل عام، هناك بالفعل طلبين للحديد. أقترح ترك المنتدى الأول بمفرده في الوقت الحالي والاستمرار في جمع الطلبات من المنتديات الأخرى. لحسن الحظ، لدينا جوجل مفتوح عند الطلب. 2006-2008، شركة سيمبل ماشينز ذ.م.م. نأخذ من نتائج البحث، على سبيل المثال، هذه المنتديات: http://www.snowlinks.ru/forum/index.php?topic=1062.0 و http://litputnik.ru/forum/index.php?action=printpage ;topic=380.0 في التذييلات نأخذ الاستعلامات التالية منها: “Powered by SMF 1.1.7” و “Powered by SMF 1.1.10” (أوصي دائمًا بإدخال الاستعلامات الخاصة بـ Hrefer بين علامتي الاقتباس، لأننا نحتاج إلى الجودة أولاً). الجميع). أعتقد أن ما نقوم به واضح، في النهاية سيكون لدينا قاعدة بيانات معينة من الاستعلامات للبحث في المنتديات على محرك SMF (تم اختياره كمثال، نفس الشيء مع المحركات الأخرى).
سوف يبدو مثل هذا:
أعتقد أن تعلم كيفية استخدام Hrumer بشكل صحيح في المرحلة الأولية أمر مهم للغاية، لأنه بمجرد أن تتعلم ذلك، يمكنك دائمًا العثور على استخدام لـ Hrumer، بغض النظر عن كيفية تغير الوضع. أصبحت الحماية أكثر تعقيدًا، وإذا تم تعزيز الحماية في بعض أنواع المحركات ولم يتمكن Khroomer من التعامل معها في الوقت الحالي، فلا فائدة من إنفاق الموارد على جمع هذه الروابط، ثم العمل عليها مع Khroomer، فهذا من الأفضل تركيز القوى على ما يعطي النتائج . وفي الوقت نفسه، إذا قام فريق Botmaster Labs بتعليم Khroomer شيئًا جديدًا، فيمكنك تشريح مريض جديد بسرعة وإعداد القاعدة لـ Khroomer بينما لا يزال المريض دافئًا. الوقت هو المال؛ وقد لا يكون المورد ذا صلة عند شراء القاعدة. تم جمعها من قبل شخص ما. بالإضافة إلى ذلك، فإن المجموعة الصحيحة من القواعد لنفسك توسع بشكل كبير الاستخدام "الأبيض" لكرومر. وهذا هو بالضبط حيث يتحرك كل شيء، شئنا أم أبينا، وعملية التبييض أو الشيب مستمرة. أصبحت الملاءات السوداء شيئًا من الماضي بكل الطرق الممكنة.
يمكن الاطلاع على جميع الجوانب الفنية الأخرى للعمل مع Hrefer في المساعدة ولا داعي للخوض فيها؛ يتم تعيين جميع الأهداف والنقاط والثواني بشكل تجريبي لكل سيارة على حدة.
على سبيل المكافأة، سأقوم هنا بنشر نموذج لتحليل محرك البحث الصيني بايدو، في أحد الأيام سألوني عنه، لذلك فعلت ذلك بشكل عرضي، أعذرني على التورية. :)
اسم المضيف=http://www.baidu.com
الاستعلام=s?wd=
قناع الروابط=
إجمالي الصفحات = 100
الصفحة التالية=
الصفحة التالية2=
CaptchaURL=
CaptchaImage=
حقل الكابتشا=
حاولت اختبار تحليلها، لم يكن هناك حظر، جمع خريفر الموارد بسرعة، وكانت جميع الاستعلامات الخاصة بالتحليل مشابهة لطلبات Google، ولكن كان هناك الكثير من الموارد الصينية، مع علاقات عامة عالية، بالإضافة إلى ذلك، كان هناك العديد من الأماكن التي لا يوجد بها الأوروبي قد تطأ قدماه من أي وقت مضى. من الأفضل تحليل الاستفسارات الصينية. ستساعدك ترجمة Google في ذلك، واكتب قائمة الكلمات الرئيسية باللغة الروسية وترجمتها إلى الصينية. الحقيقة في " كلمات"لا يمكن إضافة كلمات Hrefer باللغة الصينية، بل يجب إعادة ترميزها.
بدلا من الصينية:
في الختام، أود أن أقول إنني لم أفهم أبدًا الأشخاص الذين اشتكوا من أن طهي الخنافس تم طهيه بشكل سيء أو سيئ، ردًا على ذلك، أردت دائمًا أن أقول، أنت لا تعرف كيفية طهيها. لا يمكن لأي محلل جمع النتائج بشكل أفضل من المُحيل؛ فقط يجب أن تكون الطلبات صحيحة. Hrefer هي سيارة: جيدة، صلبة، مصنوعة باللغة الألمانية، لكن يقودها شخص وكل هذا يتوقف على مدى قيادتها؛ لا يمكنك إجبار السيارة على القيادة يمينًا ويسارًا في نفس الوقت.
هناك موضوع منفصل وهو تنظيف قواعد البيانات، لقد قمت بذلك ذات مرة منذ 3 سنوات في مسابقة سابقة. بالنسبة للجزء الأكبر، لا يزال كل شيء ذا صلة هناك، ولكن الآن يمكنك رفض التحقق من 200 حسنًا، لم تعجبني حقًا هذه العملية، وكانت هناك أخطاء كبيرة جدًا، وتم تصفية الكثير من الأشياء غير الضرورية. الآن يمكن القيام بذلك تلقائيًا تقريبًا أثناء تشغيل Khrumer، على الرغم من أن هذه العملية ليست تماثلًا كاملاً للتحقق من "200 OK". على أي حال، إلى هذه النقطة: منذ وقت ليس ببعيد، ظهرت فرصة رائعة في كرومر - لسرقة المعلومات من الموارد في وقت تشغيل المشروع. يبدو مثل هذا. تقوم بإدخال قالب ستتم معالجته أثناء التشغيل، وسيتم إدخال المعلومات التي تم جمعها من القالب في ملف xgrabbed.txt في مجلد السجلات. يمكنك استخدام هذه الوظيفة لأي شيء، رحلة الخيال ضخمة. أستخدم هذه الوظيفة مرة واحدة في الأسبوع لإزالة الروابط من قاعدة بيانات العمل "منتهية الصلاحية". ليس سرا أن المنتديات تختفي كل يوم من أجل مسح قاعدة بياناتنا من هذه الموارد، وسوف تساعدنا أداة "Autograbbing" في هذه الحالة.
بعد كل شيء، عليك أن تعترف أنه عندما نكتب في كثير من الأحيان، على سبيل المثال، http://www.laptopace.com/index.php، فإننا نرى أن هذا المجال هو بالفعل، على سبيل المثال، رجل جيد يبيع المال، ولكن لا يوجد المنتدى هناك. لذلك، من أجل رمي هذا الخبث من القاعدة، سوف نسرق. :) افتح الكود المصدري للصفحة وشاهد هذا الإدخال هناك:
الآن سوف نعرف جميع "الموتى" من جودادي بالاسم.
فيما يلي تحديد صغير لأداة Autograbbing، إذا كنت تريد مسح قاعدة بيانات النطاقات "منتهية الصلاحية" المختلفة: