שימוש נכון בתג קנוניקל

מאז שגוגל ומנועי חיפוש אחרים חשפו את תג הקנוניקל המאפשר לבעלי אתרים להצביע על תוכן משוכפל באתר שלהם ועל הדף המצביע על התוכן המקורי, יש לא מעט שאלות וחוסר בהירות מסביב לתג: מתי מומלץ להשתמש בו? האם ניתן להשתמש בו בין שני אתרים שונים? האם יש דרכים אחרות להודיע על תוכן משוכפל וכך הלאה… 

השימוש הבסיסי בתג נעשה באמצעות המבנה הבא:

<link rel="canonical" href="http://blog.example.com/dresses/green-dresses-are-awesome" />

כמו שאפשר לשים לב, מדובר בתג פשוט מאוד שבסך הכול מציין את הכתובת של דף המקור. את התג יש לשים בחלק ה – head  בתוך הדף שאותו רוצים לשייך אל הדף המקורי מבחינת התוכן…. כמו כן, רצוי להשתמש בכתובת אבסולוטית למניעת טעויות ולא להסתפק בנתיב הפנימי בלבד (pagename.html).
באותו אופן, ניתן להשתמש בתג גם בתוך ה – Header של קבצים מסוימים בשרת (HTTP Header). הדבר שימושי אם רוצים להצהיר על קבצים שהם לא דפי HTML, אך נמצאים בכמה אתרים. לדוגמה, קבצי PDF או DOC (אותם גוגל יכול לאנדקס).
גם כאן המבנה עצמו דומה למדי

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

הסבר מפורט אודות שימוש בתג עם קבצי pdf במאמר של קווין גרייבס ב moz

מתי אפשר/מומלץ להשתמש בתג קנוניקל?

  • כאשר השרת מוגדר לספק את אותו המידע על הגרסה הרגילה והמאובטחת (https) של השרת, אפשר להורות לגוגל איזו גרסה להציג בתוצאות החיפוש
  • כאשר אותו דף נגיש בשתי כתובות שונות שאינן משפיעות על תוכן הדף (סדר פרמטרים שאינו קבוע, פרמטרים שנוספים ללא השפעה על התוכן, תצוגה של דף עם כתובת ידידותית ועם מזהה/id וכד')
  • כאשר קיימת גרסה נוספת של האתר על דומיין אחר או סאב דומיין (נפוץ מאוד במקרים בהם קיימת גרסת מובייל לאתר בסאב דומיין). במקרה זה כדאי גם להטמיע תג  alternate ע"פ הדוגמא הבאה:

בדף של הגרסא הראשית יופיע התג הבא:

<link rel=”alternate” href=”m.example.com/about” />

בדף של גרסת המובייל יופיע התג הבא:

<link rel=”canonical” href=”www.example.com/about” />

שכפול תוכן באתרים אחרים ושימוש בתג

כפי שכתבנו, גוגל תומכים באופן עקרוני בציון כתובת בדומיין אחר בתג, אך עד לאחרונה לא היה ניתן להבין מעמוד העזרה הרשמי שלהם באילו מקרים הם ממליצים להשתמש בטכניקה הזו (מלבד עניין ההפניות). כיום, לאחר העדכון של העמוד, אפשר להבין כי הם מתייחסים למקרים בהם מתבצעת סינדקציה של תוכן עם אתרים אחרים. כלומר, במידה ובו אתרים משכפלים תוכן של אתר אחר ברשות על מנת להגדיל את החשיפה לתוכן ולכותב המקוריים.
בכל מקרה, חשוב להבין שהשימוש בתג מספק לאלגוריתם של גוגל סיגנל חזק למדי לגבי הגרסה המועדפת שתופיע בתוצאות החיפוש, אך הוא עשוי להשתמש גם בסיגנלים נוספים. לכן, לא מדובר בפיתרון קסם שיבטיח כי תמיד האתר המקורי יופיע בתוצאות.

כמו כן, אם אתם נמצאים בצד ששם את תג הקנוניקל אצלו, אתם אמנם לא אלו שתיהנו מהנראות המשופרת בתוצאות החיפוש, אבל אם האתר שלכם משתמש בהרבה סינדיקציות, כך תוכלו להיות בטוחים שהוא לפחות לא ייענש או שהדירוגים הכללים שלו יפגעו (כלומר, שהוא לא יפעיל יותר מדי מנגנוני ספאם של גוגל).
דוגמאות לשימוש לא נכון בתג

  • שכפול של התג לאורך כל דפי האתר כך שיפנו לדף הראשי : עשוי למחוק אותם מתוצאות החיפוש ולהשאיר רק את העמוד שהתג מפנה אליו!
  • אם ניתן לגשת לדף מסוים דרך כמה כתובות, חשוב לשמור על אחידות בתג וכמובן לבדוק שהגרסה שבוחרים עדיין קיימת ולא מפנה לעמוד שגיאה, לא חסומה על ידי robots.txt וכו'
  • במידה ומבצעים סינדיקציה כפי שתיארנו בסעיף הקודם, חשוב שהדף שמפרסם תמונת מראה של העמוד המקורי יפנה למקור ולא אל עצמו, אחרת לא תהיה לתג משמעות