תהליך ההמרה של נתונים מטופס אחד לצורה אחרת מכונה קידוד. הוא משמש כדי להפוך את הנתונים כך שניתן לתמוך בנתונים ולהשתמש בהם על ידי מערכות שונות. הקידוד פועל באופן דומה להמרת טמפרטורה מ מעלות צלזיוס לפרנהייט, מכיוון שהוא פשוט מומר בצורה אחרת, אבל הערך המקורי תמיד נשאר זהה. הקידוד משמש בעיקר בשני תחומים:
הערה: הקידוד שונה מהצפנה שכן מטרתו העיקרית אינה להסתיר את הנתונים אלא להמיר אותם לפורמט כך שניתן יהיה לצרוך אותם כראוי.
בנושא זה, אנו הולכים לדון בסוגים השונים של טכניקות קידוד המשמשות במחשוב.
סוג טכניקת קידוד
קידוד תווים
קידוד תווים מקודד תווים לבייטים . זה מודיע למחשבים כיצד לפרש את האפס והאחדות לתווים, מספרים וסמלים אמיתיים. המחשב מבין נתונים בינאריים בלבד; לפיכך נדרש להמיר תווים אלו לקודים מספריים. כדי להשיג זאת, כל תו מומר לקוד בינארי, ולשם כך נשמרים מסמכי טקסט עם סוגי קידוד. ניתן לעשות זאת על ידי צימוד מספרים עם תווים. אם לא נחיל קידוד תווים, האתר שלנו לא יציג את התווים והטקסט בפורמט מתאים. מכאן שזה יקטין את הקריאות, והמכונה לא תוכל לעבד נתונים כראוי. בנוסף, קידוד תווים מוודא שלכל תו יש ייצוג מתאים בפורמט מחשב או בינארי.
ישנם סוגים שונים של טכניקות קידוד תווים, המפורטות להלן:
קידוד HTML
קידוד HTML משמש להצגת דף HTML בפורמט מתאים. עם קידוד, דפדפן אינטרנט לומד באיזו מערכת תווים יש להשתמש.
ב-HTML, ישנם תווים שונים בשימוש ב-HTML Markup כגון . כדי לקודד את התווים האלה כתוכן, עלינו להשתמש בקידוד.
קידוד כתובת אתר
כתובת URL (איתור משאבים אחיד) נעשה שימוש בקידוד להמיר תווים בפורמט כזה שניתן להעבירם דרך האינטרנט . זה ידוע גם בתור קידוד אחוז. קידוד כתובת האתר מתבצע כדי לשלוח את כתובת ה-URL לאינטרנט באמצעות ערכת התווים ASCII. תווים שאינם ASCII מוחלפים ב-%, ואחריהם הספרות הקסדצימליות.
קידוד UNICODE
Unicode הוא תקן קידוד עבור ערכת תווים אוניברסלית. הוא מאפשר קידוד, ייצוג ולטפל בטקסט המיוצג ברוב השפות או מערכות הכתיבה הזמינות ברחבי העולם. הוא מספק נקודת קוד או מספר עבור כל תו בכל שפה נתמכת. זה יכול לייצג בערך את כל התווים האפשריים האפשריים בכל השפות. רצף מסוים של ביטים ידוע כיחידת קידוד.
תקן UNICODE יכול להשתמש ב-8, 16 או 32 סיביות כדי לייצג את התווים.
תקן Unicode מגדיר את ה-Unicode Transformation Format (UTF) כדי לקודד את נקודות הקוד.
לתקן הקידוד UNICODE יש את סכימות ה-UTF הבאות:
ה-UTF8 מוגדר על ידי תקן UNICODE, שהוא קידוד תווים ברוחב משתנה המשמש בתקשורת אלקטרונית. UTF-8 מסוגל לקודד את כל 1,112,064 נקודות קוד תווים חוקיות ב-Unicode באמצעות אחת עד ארבע יחידות קוד של בייט אחד (8 סיביות).
קידוד UTF16 מייצג את נקודות הקוד של תו באמצעות אחד משני מספרים שלמים של 16 סיביות.
קידוד UTF32 מייצג כל נקודת קוד כמספרים שלמים של 32 סיביות.
קידוד Base64
קידוד Base64 משמש לקידוד נתונים בינאריים לתווי ASCII שוות ערך. הקידוד Base64 משמש במערכת הדואר מכיוון שמערכות דואר כגון SMTP אינן יכולות לעבוד עם נתונים בינאריים מכיוון שהן מקבלות נתונים טקסטואליים ASCII בלבד. הוא משמש גם באימות HTTP פשוט כדי לקודד את האישורים. יתר על כן, הוא משמש גם להעברת הנתונים הבינאריים לעוגיות ולפרמטרים אחרים כדי להפוך את הנתונים לבלתי קריאים כדי למנוע שיבוש. אם תמונה או קובץ אחר מועברים ללא קידוד Base64, הוא ייפגם מכיוון שמערכת הדואר לא מסוגלת להתמודד עם נתונים בינאריים.
Base64 מייצג את הנתונים בלוקים של 3 בתים, כאשר כל בייט מכיל 8 ביטים; לפיכך הוא מייצג 24 סיביות. 24 ביטים אלה מחולקים לארבע קבוצות של 6 ביטים. כל אחת מהקבוצות או הנתחים הללו מומרים לערך Base64 שווה ערך.
קידוד ASCII
קוד אמריקאי סטנדרטי להמרת מידע (ASCII) הוא סוג של קידוד תווים. זה היה תקן קידוד התווים הראשון שיצא בשנת 1963.
קוד ASCII משמש לייצוג תווים באנגלית כמספרים, כאשר לכל אות מוקצה מספר מ- 0 עד 127. רוב סכימות קידוד התווים המודרניות מבוססות על ASCII, אם כי הן תומכות בתווים רבים נוספים. זהו קידוד בתים בודדים רק באמצעות 7 הסיביות התחתונות. בקובץ ASCII, כל תו אלפביתי, מספרי או מיוחד מיוצג במספר בינארי של 7 סיביות. לכל תו של המקלדת יש ערך ASCII שווה ערך.
קידוד תמונה ואודיו ווידאו
קידוד תמונה ואודיו ווידאו מבוצעים כדי לחסוך בשטח אחסון. קובץ מדיה כגון תמונה, אודיו ווידאו מקודדים כדי לשמור אותם בפורמט יעיל ודחוס יותר.
קבצים מקודדים אלה מכילים את אותו תוכן באיכות דומה בדרך כלל, אך בגודל דחוס, כך שניתן לשמור אותם בפחות מקום, ניתנים להעברה בקלות באמצעות דואר, או ניתנים להורדה במערכת.
אנחנו יכולים להבין את זה בתור . קובץ אודיו WAV מומר לקובץ MP3 כדי להקטין את הגודל ב-1/10ה'לגודלו המקורי.