رموز PHP. الشخصيات والسلاسل. الحروف الهجائية اليونانية والقبطية

20.01.2024

أحرف HTML الخاصة هي بنيات لغة خاصة تشير إلى أحرف من مجموعة الأحرف المستخدمة في الملفات النصية. يعرض الجدول قائمة بالأحرف المحجوزة والخاصة التي لا يمكن إضافتها إلى الكود المصدري لمستند HTML باستخدام لوحة المفاتيح:

  • الأحرف التي لا يمكن إدخالها باستخدام لوحة المفاتيح (على سبيل المثال، رمز حقوق النشر)
  • الأحرف المخصصة لوضع العلامات (على سبيل المثال، علامة أكبر من أو أقل من)

تتم إضافة هذه الأحرف باستخدام رمز رقمي أو اسم.

رمزرمز رقمياسم الرمزوصف
" " " علامة الاقتباس
" " " الفاصلة العليا
& & & علامة العطف
< < أقل من علامة
> > > المزيد من الإشارة
مسافة غير منقسمة (المسافة غير المنفصلة هي مسافة تظهر داخل السطر كمسافة عادية، ولكنها لا تسمح لبرامج العرض والطباعة بفصل السطر عند هذه النقطة.)
¡ ¡ ¡ علامة تعجب مقلوبة
¢ ¢ ¢ سنت
£ £ £ رطل.
¤ ¤ ¤ العملات
¥ ¥ ¥ ين
¦ ¦ ¦ شريط عمودي مكسور
§ § § قسم
¨ ¨ ¨ الفاصل الزمني (السيريلية)
© علامة حقوق النشر
ª ª ª الأس الترتيبي المؤنث
« « « اقتباسات فرنسية (متعرجة) - اليسار
¬ ¬ ¬ تعبيرات النفي
® ® ® علامة تجارية مسجلة
¯ ¯ ¯ الفاصل الزمني لماكرون
° ° ° درجة
± ± ± زائد أو ناقص
² ² ² مرتفع 2
³ ³ ³ مرتفع 3
´ ´ ´ الفاصل الزمني الحاد
µ µ µ مايكرو
فقرة
· · · نقطة المنتصف
¸ ¸ ¸ الفاصل الزمني سيديلا
¹ ¹ ¹ مرتفع 1
º º º الأس الترتيبي المذكر
» » » اقتباسات فرنسية (متعرجة) - صحيح
¼ ¼ ¼ 1/4 جزء
½ ½ ½ 1/2 جزء
¾ ¾ ¾ 3/4 أجزاء
¿ ¿ ¿ علامة استفهام معكوسة
× × × الضرب
÷ ÷ ÷ قسم
́ ́ توكيد
Œ Œ Œ رباط رأس المال OE
œ œ œ حرف ربط صغير oe
Š Š Š S مع التاج
š š š حرف S صغير مع التاج
Ÿ Ÿ Ÿ رأس المال Y مع تيارا
ƒ ƒ ƒ و مع هوك
ˆ ˆ ˆ لهجة dicritic
˜ ˜ ˜ التلدة الصغيرة
- اندفاعة
اندفاعة م
الاقتباس المفرد الأيسر
اقتباس واحد صحيح
اقتباس واحد أسفل
علامات الاقتباس المزدوجة اليسرى
علامات الاقتباس المزدوجة الصحيحة
علامات الاقتباس المزدوجة السفلية
خنجر
خنجر مزدوج
. رصاصة
القطع الأفقي
جزء في المليون (بالآلاف)
دقائق
ثواني
اقتباس زاوية يسرى واحد
اقتباس زاوية يمين واحد
تراكيب
اليورو
™ أو علامة تجارية
السهم الأيسر
سهم لأعلى
السهم الأيمن
سهم لأسفل
سهم مزدوج
سهم عودة النقل
الزاوية اليسرى العليا
الزاوية اليمنى العليا
الزاوية اليسرى السفلى
الزاوية اليمنى السفلى
المعين
قمم
يعبر
الديدان
الماس

الرموز الرياضية المدعومة في HTML

رمزرمز رقمياسم الرمزوصف
لأي شخص، للجميع
جزء
موجود
مجموعة فارغة
مشغل هاميلتون (نابلا)
ينتمي إلى المجموعة
لا ينتمي إلى المجموعة
أو
عمل
مجموع
ناقص
الضرب أو المشغل المترافق مع
× × & مرات علامة الضرب
الجذر التربيعي
التناسب
إنفينيتي
التعددية
ركن
و
أو
تقاطع
منظمة
أساسي
لهذا السبب
يحب
قابلة للمقارنة
متساوية تقريبًا
لا يساوي
بشكل مماثل
أقل من أو يساوي


أقل من أو يساوي
أكبر من أو يساوي


أكبر من أو يساوي
مجموعة فرعية
مجموعات فرعية
ليست مجموعة فرعية
مجموعة فرعية
مجموعة شاملة
المبلغ المباشر
منتج أكثر توتراً
عمودي
مشغل النقطة

الحروف الهجائية اليونانية والقبطية

رمز رمز رقمي رمز سداسي عشري اسم الرمز
Ͱ Ͱ Ͱ
ͱ ͱ ͱ
Ͳ Ͳ Ͳ
ͳ ͳ ͳ
ʹ ʹ ʹ
͵ ͵ ͵
Ͷ Ͷ Ͷ
ͷ ͷ ͷ
ͺ ͺ ͺ
ͻ ͻ ͻ
ͼ ͼ ͼ
ͽ ͽ ͽ
; ; ;
΄ ΄ ΄
΅ ΅ ΅
Ά Ά Ά
· · ·
Έ Έ Έ
Ή Ή Ή
Ί Ί Ί
Ό Ό Ό
Ύ Ύ Ύ
Ώ Ώ Ώ
ΐ ΐ ΐ
Α Α Α Α
Β Β Β Β
Γ Γ Γ Γ
Δ Δ Δ Δ
Ε Ε Ε Ε
Ζ Ζ Ζ Ζ
Η Η Η Η
Θ Θ Θ Θ
Ι Ι Ι Ι
Κ Κ Κ Κ
Λ Λ Λ Λ
Μ Μ Μ Μ
Ν Ν Ν Ν
Ξ Ξ Ξ Ξ
Ο Ο Ο Ο
Π Π Π Π
Ρ Ρ Ρ Ρ
Σ Σ Σ Σ
Τ Τ Τ Τ
Υ Υ Υ Υ
Φ Φ Φ Φ
Χ Χ Χ Χ
Ψ Ψ Ψ Ψ
Ω Ω Ω Ω
Ϊ Ϊ Ϊ
Ϋ Ϋ Ϋ
ά ά ά
έ έ έ
ή ή ή
ί ί ί
ΰ ΰ ΰ
α α α α
β β β β
γ γ γ γ
δ δ δ δ
ε ε ε ε
ζ ζ ζ ζ
η η η η
θ θ θ θ
ι ι ι ι
κ κ κ κ
λ λ λ λ
μ μ μ μ
ν ν ν ν
ξ ξ ξ ξ
ο ο ο ο
π π π π
ρ ρ ρ ρ
ς ς ς ς
σ σ σ σ
τ τ τ τ
υ υ υ υ
φ φ φ φ
χ χ χ χ
ψ ψ ψ ψ
ω ω ω ω
ϊ ϊ ϊ
ϋ ϋ ϋ
ό ό ό
ύ ύ ύ
ώ ώ ώ
Ϗ Ϗ Ϗ
ϐ ϐ ϐ
ϑ ϑ ϑ ϑ
ϒ ϒ ϒ ϒ
ϓ ϓ ϓ
ϔ ϔ ϔ
ϕ ϕ ϕ ϕ
ϖ ϖ ϖ ϖ
ϗ ϗ ϗ
Ϙ Ϙ Ϙ
ϙ ϙ ϙ
Ϛ Ϛ Ϛ
ϛ ϛ ϛ
Ϝ Ϝ Ϝ Ϝ
ϝ ϝ ϝ ϝ
Ϟ Ϟ Ϟ
ϟ ϟ ϟ
Ϡ Ϡ Ϡ
ϡ ϡ ϡ
Ϣ Ϣ Ϣ
ϣ ϣ ϣ
Ϥ Ϥ Ϥ
ϥ ϥ ϥ
Ϧ Ϧ Ϧ
ϧ ϧ ϧ
Ϩ Ϩ Ϩ
ϩ ϩ ϩ
Ϫ Ϫ Ϫ
ϫ ϫ ϫ
Ϭ Ϭ Ϭ
ϭ ϭ ϭ
Ϯ Ϯ Ϯ
ϯ ϯ ϯ
ϰ ϰ ϰ ϰ
ϱ ϱ ϱ ϱ
ϲ ϲ ϲ
ϳ ϳ ϳ
ϴ ϴ ϴ
ϵ ϵ ϵ ϵ
϶ ϶ ϶ ϶
Ϸ Ϸ Ϸ
ϸ ϸ ϸ
Ϲ Ϲ Ϲ
Ϻ Ϻ Ϻ
ϻ ϻ ϻ
ϼ ϼ ϼ
Ͻ Ͻ Ͻ
Ͼ Ͼ Ͼ
Ͽ Ͽ Ͽ

لماذا هناك حاجة إلى أحرف خاصة وكيفية استخدامها

لنفترض أنك قررت وصف بعض العلامات على صفحتك، ولكن بما أن المتصفح يستخدم الأحرف< и >مثل بداية العلامة ونهايتها، فإن تطبيقها داخل محتوى كود html الخاص بك يمكن أن يؤدي إلى حدوث مشكلات. لكن لغة HTML تمنحك طريقة سهلة لتعريف هذه الأحرف وغيرها من الأحرف الخاصة باستخدام اختصارات بسيطة تسمى إشارات إلى الرموز.

دعونا ننظر في كيفية عمل هذا. لكل حرف يعتبر خاصًا أو تريد استخدامه على صفحة الويب الخاصة بك ولكن لا يمكن طباعته في المحرر الخاص بك (مثل رمز حقوق الطبع والنشر)، تجد الاختصار وتطبعه في كود html بدلاً من الحرف المطلوب. على سبيل المثال، بالنسبة للرمز ">" فإن الاختصار هو > ، وبالنسبة للرمز "<" - < .

لنفترض أنك تريد طباعة "Element مهم جداً" على صفحته. بدلاً من ذلك، سيتعين عليك استخدام مراجع للرموز التي تحتاجها لعرض الإدخال بشكل صحيح، وفي النهاية يجب أن يبدو إدخالك في الكود كما يلي:

عنصر مهم جدا

يحاول "

هناك حرف خاص آخر تحتاج إلى معرفته وهو رمز & (علامة الضم). إذا كنت تريد ظهوره على صفحة HTML الخاصة بك، فاستخدم الارتباط & بدلاً من الحرف &.

(بي إتش بي 4، بي إتش بي 5، بي إتش بي 7)

أتش تي أم أل Specialchars — تحويل الأحرف الخاصة إلى كيانات HTML

وصف

خيط htmlspecialchars (سلسلة سلسلة $ [, إشارات $ = ENT_COMPAT | ENT_HTML401 [, سلسلة ترميز $ = ini_get("default_charset") [, منطقي $double_encode = صحيح ]]])

في HTML، بعض الأحرف لها معاني خاصة ويجب تمثيلها ككيانات HTML للحفاظ على معناها. تقوم هذه الدالة بإرجاع السلسلة التي خضعت لهذه التحويلات. إذا كنت بحاجة إلى تحويل جميع الكيانات الممكنة، استخدم.

htmlentities() تقوم هذه الدالة بإرجاع السلسلة التي خضعت لهذه التحويلات. إذا كنت بحاجة إلى تحويل جميع الكيانات الممكنة، استخدمالوظائف (التي تحول فقط السلاسل الفرعية ذات الكيانات المقابلة). من الضروري استخدام الوظيفة.

mb_encode_numericentity()

  • يتم إجراء التحولات التالية:
  • يتم تحويل "&" (علامة الضم) إلى "&" يتم تحويل """ (علامة الاقتباس المزدوجة) إلى """ في الوضع ENT_NOQUOTES
  • لم يتم تعيين. يتم تحويل """ (علامة الاقتباس المفردة) إلى """ (أو ") فقط في الوضع.
  • "<" (знак "меньше чем") преобразуется в "<"
  • ENT_QUOTES

يتم تحويل ">" (أكبر من العلامة) إلى ">"

قائمة المعلمات سلسلة للتحويل ().

خيط قناع نقطي للإشارات التالية التي تحدد وضع معالجة علامات الاقتباس والترميزات غير الصحيحة ونوع المستند المستخدم. الافتراضي هو.

ENT_COMPAT | ENT_HTML401
قيم معلمات الأعلام المتاحة وصف
اسم ثابت ENT_COMPAT
يتم تحويل """ (علامة الاقتباس المفردة) إلى """ (أو ") فقط في الوضع يحول علامات الاقتباس المزدوجة، مع ترك علامات الاقتباس المفردة دون تغيير.
يتم تحويل """ (علامة الاقتباس المزدوجة) إلى """ في الوضع تحويل علامات الاقتباس المزدوجة والمفردة.
يترك علامات الاقتباس المزدوجة والمفردة دون تغيير. ENT_IGNORE
بدون أي رسائل إعلام، يتجاهل تسلسلات التعليمات البرمجية غير الصالحة بدلاً من إرجاع سلسلة فارغة. لا يوصى باستخدام هذه العلامة لأنها قد تؤدي إلى » آثار أمنية سلبية.
ENT_SUBSTITUTE يستبدل تسلسلات التعليمات البرمجية غير الصحيحة بحرف Unicode البديل U+FFFD عند استخدام UTF-8 وFFFD؛ عند استخدام ترميز مختلف، بدلاً من إرجاع سلسلة فارغة.
ENT_DISALLOWED يستبدل رموز الأحرف غير الصالحة لنوع مستند معين بحرف Unicode البديل U+FFFD (UTF-8) أو FFFD؛
(عند استخدام ترميز مختلف) بدلاً من ترك كل شيء كما هو. يمكن أن يكون هذا مفيدًا، على سبيل المثال، للتأكد من أن مستندات XML ذات المحتوى الخارجي المضمن صحيحة رسميًا. ENT_HTML401
معالجة التعليمات البرمجية وفقًا لـ HTML 4.01. ENT_XML1
معالجة التعليمات البرمجية وفقًا لـ XML 1. ENT_XHTML
معالجة التعليمات البرمجية وفقًا لـ XHTML.

ENT_HTML5

معالجة التعليمات البرمجية وفقًا لـ HTML 5. ترميزوسيطة اختيارية تحدد الترميز المستخدم عند تحويل الأحرف. إذا لم يتم تحديدها، فإن القيمة الافتراضية للتشفير تعتمد على إصدار PHP المستخدم. في PHP 5.6 والإصدارات الأحدث، يتم تعيين القيمة الافتراضية على خيار التكوين default_charset..

على الرغم من أن هذه الوسيطة اختيارية من الناحية الفنية، إلا أنه يوصى بشدة بتحديد القيمة الصحيحة للتعليمات البرمجية الخاصة بك إذا كنت تستخدم PHP 5.5 أو أعلى، أو إذا كان خيار التكوين default_charset الخاص بك قد تم تعيينه بشكل غير صحيح للإدخال.

لأغراض وظيفة الترميز هذه إذا لم يتم تحديدها، فإن القيمة الافتراضية للتشفير تعتمد على إصدار PHP المستخدم. في PHP 5.6 والإصدارات الأحدث، يتم تعيين القيمة الافتراضية على خيار التكوين default_charset., ايزو-8859-15, ترميز, cp866, cp1251, cp1252و KOI8-Rمتكافئة عمليا، على افتراض أن السلسلة نفسها تحتوي على أحرف صالحة في التشفير المحدد، ثم يتم تعديل الأحرف أتش تي أم أل Specialchars()، سيبقى في نفس الأماكن في كل هذه الترميزات.

الترميزات التالية مدعومة:

الترميزات المدعومة
الترميز الألقاب وصف
إذا لم يتم تحديدها، فإن القيمة الافتراضية للتشفير تعتمد على إصدار PHP المستخدم. في PHP 5.6 والإصدارات الأحدث، يتم تعيين القيمة الافتراضية على خيار التكوين default_charset. ISO8859-1 أوروبا الغربية اللاتينية-1.
ايزو-8859-5 ISO8859-5 نادرًا ما يُستخدم الترميز السيريلي (لاتيني/سيريلي).
ايزو-8859-15 ISO8859-15 أوروبا الغربية اللاتينية-9. إضافة علامة اليورو والأحرف الفرنسية والفنلندية إلى الترميز اللاتيني-1 (ISO-8859-1).
ترميز 8 بت Unicode، متوافق مع ASCII.
cp866 آي بي إم 866، 866 الترميز السيريلي المستخدم في DOS.
cp1251 ويندوز-1251، فوز-1251، 1251 الترميز السيريلي المستخدم في Windows.
cp1252 ويندوز-1252، 1252 الترميز الأوروبي الغربي المستخدم في Windows.
KOI8-R koi8-ru، koi8r الترميز الروسي.
كبير5 950 الصينية التقليدية، وتستخدم بشكل رئيسي في تايوان.
GB2312 936 الصينية المبسطة، مجموعة الأحرف الوطنية القياسية.
BIG5-HKSCS تم استخدام Big5 الممتد في هونغ كونغ.
Shift_JIS سجيس، سجيس-وين، cp932، 932 الترميز الياباني.
EUC-JP EUCJP، EUCJP-WIN الترميز الياباني.
ماكرومان الترميز المستخدم في نظام التشغيل Mac OS.
"" يقوم السطر الفارغ بتنشيط الوضع لتحديد التشفير من ملف البرنامج النصي (Zend multibyte) وdefault_charset والإعدادات المحلية الحالية (انظر. nl_langinfo()و تعيين اللغة ())، بالترتيب الموضح.

لا ينصح للاستخدام.: تعليق

الترميزات الأخرى غير مدعومة؛ سيتم تطبيق الترميز الافتراضي بدلاً من ذلك وسيتم إنشاء تحذير.

double_encode

إذا تم تعطيل خيار double_encode، فلن يقوم PHP بتحويل كيانات html الموجودة. بشكل افتراضي، يتم تحويل كل شيء دون قيود.
0 1 2 3 4 5 6 7 8 9: ; ؟ @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ^ _ ` a b c d e f g h i j k l m n o p q r s t u v w x y z ( | ) ~ ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ® ¯ ° ± ² ³ ´ μ ¶ · ¸ ¹ ´ » ¼ ½ ¾ ¿ À Â Â Ä Å Æ Ç È É Ê Ë Ì Í Î Ï Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß à á ã ä å æ ç è é ê ë í î ð ñ ò ó ô õ ö ÷ ø ù ú ü þ ÿ Ā Ă Ą ą Ć Ĉ Ċ ċ Č Ď Đ đ Ē ē Ĕ Ė ė Ę Ě Ĝ Ğ Ġ ġ Ģ Ĥ ĥ Ħ ħ ĩ Ī ī Ĭ Į į ı Ĵ ĵ ķ Ĺ ļ ľ Ŀ ŀ Ń ń ņ Ň ň Ŋ ŋ Ō Ŏ ŏ Ő ő Œ Ŕ ŕ Ŗ ŗ Ř ř ś Ŝ ŝ Ş Š š Ţ Ť ť ŧ Ũ ũ Ū Ŭ Ů Ű ű ų Ŵ ŵ Ŷ Ÿ Ź ź ż Ž ſ ΅ Ά · Έ Ή Ί Ό Ώ ΐ Α Β Γ Δ Ε Ζ أنا أحبك كثيرًا σ τ υ φ χ ψ ω ϊ ϋ ό ύ ώ Ё Ѓ Є Ѕ І Ї Љ Њ Ќ Ў Џ A B C D E F G H I J J K L M N O P R S T U V H C CH W Y J J a b c d e g h i j k l m no p r s t u f x

إنها مجموعة من الرموز المرئية التي يتم تمثيلها هنا على أنها يهربتسلسلات" &#الرقم". هذا، على سبيل المثال، الرسالة الروسية أ- هذا &#1040. أي حرف له بديله، والذي يتم تحويله في المتصفح إلى الحرف نفسه، أي إذا قمت بوضع نص html &#1040سيكون الحرف الروسي مرئيًا في المتصفح أ.

وظيفة استبدال_cyr($path )(
بحث $= صفيف("Y"، "A"، "B"، "C"، "G"، "D"، "E"، "F"، ""Z"، "I"، "Y"، "K"، "L"، "M"، "N"، "O"، "P" ""، ""R""، ""S""، ""T""، ""U""، ""F" "، ""X""، ""C""، ""H"" ، ""Ш""، ""Ш""، ""Ъ""، ""И""، ""л""، ""Э""، ""У""، ""Я""، ""a"، "b"، "c"، "d"، "d"، "e"، "g"، "h" ، ""i ""، ""th""، ""k""، ""l""، ""m""، ""n""، ""o""، ""p""، " "r"" ، ""s""، ""t""، ""u""، ""f""، ""x""، ""ts""، ""h""، ""w ""، ""sch"، "b"، "y"، "b"، "e"، "yu"، "ya"، "e"، ""0 "e")؛
$ استبدال = صفيف("Y"، "A"، "B"، "C"، "G"، "D"، "E"، "F"، "Z"، "I"، "J"، "K"، "" L"، "M"، "N"، "O"، "P"، "R"، "S"، "T"، "U"، "F"، "X"، "C"، "H" ، "Ш"، "Ш"، "Ъ"، "ы"، "b"، "E"، "Yu"، "I"، "a"، "b"، "c"، "d"، " د"، "f"، "g"، "z"، "i"، "th"، "k"، "l"، "m"، "n"، "o"، "p"، "r" ، “s”، “t”، “y”، “f”، “x”، “ts”، “ch”، “sh”، “sch”، ​​“b”، “s”، “b”، “ ه"، "يو"، "يا"، "ه"، "0")؛
يعود preg_replace($بحث،$استبدال،$مسار)؛
}
$html_text = "ABBCD";
مطبعةاستبدال_cyr($html_text);
// الحصول على الإخراج
// &#1040;BVGD
// في المتصفح سيكون مرئيًا: ABCD
// أي أنه يمكن عرض نص HTML هذا بأي ترميز
?>

لقد أظهرنا وظيفة تقوم بتغيير جميع الحروف الروسية إلى معادلاتها الخاصة بالهروب، بحيث يظل النص دون تغيير في أي ترميز. قد تقول، لماذا إذن لا يستخدم أحد هذا الأسلوب؟ بعد كل شيء، إذن ليس عليك استخدام ترميزات المتصفح! نعم، ولكن هناك خاصية سيئة صغيرة لمستند html - يزداد حجمه بالبايت عدة مرات وسيتم تحميل الصفحة بشكل أبطأ بكثير.

لقد نظرنا إلى الرموز المرئية، ولكن هناك أيضًا رموزًا غير مرئية.


نحصل على هذه المطبوعة:
الرموز غير مرئية هنا
هنا يمكنك رؤية الرموز \000 \001 \002 \003 \004 \005 \006 \a \b \t \n \v \f \r

حاولنا أولاً طباعة السلسلة كما هي، ويمكنك أن ترى أنه لا توجد أحرف. وفي السطر الثاني سبقنا جميع أحرف هذا السطر بشرطة مائلة، فأصبحت مرئية. أي أن هناك أحرفًا عندما تسبقها شرطة مائلة، فإنها تعني شيئًا ما. هذه أحرف غير قابلة للطباعة. الأكثر ضرورة منهم \nهو حرف العودة. وينتهي أي سطر. على سبيل المثال، إذا نظرت إلى كود html الخاص بالملف الذي تعرضه حاليًا، فلن ترى الرمز في نصه \n، لكنه يقف في نهاية كل سطر، فهو ببساطة غير مرئي، حيث أن السطر كان غير مرئي حتى سبقنا جميع أحرفه بشرطة مائلة.

الأحرف غير المطبوعة التي ستواجهها:
\ - فضاء
\n - عودة إلى السطر الجديد (الانتقال إلى السطر الجديد)
\r - عودة إلى بداية السطر (الانتقال إلى بداية السطر)
\t - حرف علامة التبويب الطولي (مسافة غير مرئية)

على سبيل المثال، لكتابة سطر في ملف نصي، عليك القيام بذلك

إذا كتبت هذه السطور في ملفك، فلن ترى الأحرف الأخيرة، على الرغم من أنها ستكون موجودة في السطر. توفر علامة التبويب الطولية المضافة إلى السطر مساحة غير مرئية؛ إذا وضعت \t في سطر وكتبته في ملف، فلن ترى هذا الحرف أيضًا، فهو غير مرئي.
أي أننا يجب أن نضع في اعتبارنا أن كل سطر يُقرأ من الملف ينتهي \nأو على أنظمة ويندوز \r\n، عند كتابة أسطر في ملف، من الضروري وضع \n في نهاية كل سطر، وأيضًا في السطر المقروء من الملف يمكن أن يكون \t.

هل رأيت أن هناك أحرفًا غير قابلة للطباعة:

\000 \001 \002 \003 \004 \005 \006 \a \b \v \f \r

هذه الشخصيات ضارة جدًا بالنسبة لنا، حيث إنها ضرورية لتكوين الملفات الثنائية. في المستقبل، لن نقوم أنا وأنت بحفظ البيانات إلا في ملفات بسيطة، لذا يجب إزالة هذه الأحرف من كل ما يصلنا من مصادر غير معروفة. أي أنه قبل كتابة البيانات إلى ملفاتنا، سنقوم بإزالة الأحرف الضارة.

لقد تركنا جميع الأحرف القابلة للطباعة واثنين من الأحرف غير القابلة للطباعة، والتي ستكون مفيدة لنا أيضًا في المستقبل.

مطبعة "\300 \301 \302 \303 \304 \305 \306 \307 \310 \311 \312 \313 \314 \315 \316 \317 \320 \321 \322 \323 \324 \325 \326 \327 \330 \331 \332 \333 \334 \335 \336 \337 \340 \341 \342 \343 \344 \345 \346 \347 \350 \351 \352 \353 \354 \355 \356 \357 \360 \361 \362 \363 \364 \365 \366 \367 \370 \371 \372 \373 \374 \375 \376 \377";
?>

سيكون إخراج البرنامج النصي:
A B C D E F G H I J J K L M N O P R S T U V X C CH W Y Y J a b c d e g h i j k l m no p s t u f x c ch sh sh y y y
أي أن الحرف \300، المكتوب بهذه الطريقة في السطر، تم استبداله عند طباعته بحرف روسي أ. ونتيجة لذلك، بهذه الطريقة قمنا بطباعة الحروف الأبجدية الخاصة بنا.

أي أن الشرطة المائلة تعمل على استبدال الأحرف التي تسبقها؛ فهناك أحرف غير قابلة للطباعة، ولكن هناك أيضًا أحرف قابلة للطباعة.

لذلك، في النهاية، نظرنا إلى الرموز التي يمكن أن تكون موجودة.
المطبوعة هي تلك الأحرف التي ستكون مرئية بعد الطباعة.
الأحرف غير القابلة للطباعة مثل "\something" المكتوبة في ملف نصي لن تكون مرئية للعين، على الرغم من أنها ستكون موجودة في السطر.

شخصيات سيئة.

إذا نظرنا عن كثب، فسنرى أنه يتم الإشارة إلى بعض الرموز بعدة طرق، وهذا يجعل من الصعب أحيانًا معالجة الصفحات التي تحتوي على مثل هذه الرموز ويجعل حياتنا أكثر صعوبة عندما نقوم، على سبيل المثال، بطباعة بيانات المستخدم التي أرسلوها إلى ضيفنا كتاب، الخ. أي أنه من المستحسن استبدال كافة الأحرف المتكررة بحرف واحد . للوهلة الأولى، تبدو هذه فكرة مجنونة، ولكن عندما تواجه حقيقة أنك تريد تغيير شيء ما في نص HTML الخاص بك، فسوف تواجه مشكلة "ترتيب الأحرف". بعد ذلك، سننظر في دالة تغير جميع معادلاتها في النص إلى أربعة معادلات رئيسية: " " - ...

مزدوج أعزب اندفاعة ثلاث نقاط
رمز " - ...
أي ما يعادل في نص HTML " (") " - ...
متشابهون في المعنى،
يتم عرضها في نص HTML
“
”
«
»
“
”
«
»
‘
’
‘
’
–
—
–
—
… …

دعونا نؤلف دالة عن طريق استبدال جميع علامات الاقتباس المزدوجةإلى سجل موحد واحد: "

الآن لدينا وظيفة ستحل محل in نص HTMLجميع علامات الاقتباس المزدوجة هي " ، وجميع علامات الاقتباس المفردة هي "، وجميع الأحرف التي تشبه الشرطة هي -، وجميع علامات الحذف هي ثلاث نقاط فقط.

جيد،
من فضلك أخبرني ماذا أفعل إذا كنت بحاجة إلى قبول رسالة نصية من المستخدم بأي شكل من الأشكال، بما في ذلك الرسائل الخبيثة البحتة،
كيف يمكنني معالجة بياناته وحتى لا ينحني البرنامج النصي وأسجل في قاعدة بيانات mysql ثم أعرضها على الشاشة مع النتائج...
على سبيل المثال مثل tinyurl.
بشكل عام، من فضلك أخبرني بالرموز الضارة لـ php وmysql حتى يمكن استبدالها.
أقوم بفحص البراز القياسي، لكني لا أعرف ما يجب فعله مع البراز الآخر، وإلا سينتهي بي الأمر ببرنامج نصي مسرب. : (ربما

إجابة:


لدي سؤال.
ماذا يعني في نهايات المصفوفات؟
"0"
""0"ه"

الإجابة: هـ - معالجة كود Php مع استبدال جميع العناصر بما يعادلها... قرار استبدال الصفر بصفر هو قراري شخصيًا، حيث لم أجد بديلًا مناسبًا أكثر... يبدو أنه عالمي ومناسب لـ كل شيء... فكيف، في بعض الأحيان لا نعرف ما هي البدائل التي سنقوم بها، لكننا ننشئ المصفوفات ديناميكيًا، تلك التي نغيرها وتلك التي نغيرها.


شكرا جزيلا للمؤلف، وإلا فإن الحذف دفعني إلى حالة هستيرية.

الجواب: نعم، الحذف من الأشياء القبيحة...


احترام كبير للمؤلف!
لقد كنت أجوب الإنترنت لفترة طويلة بحثًا عن المعلومات وهنا يأتي التنوير!
شكرًا لك مرة أخرى!

إجابة:


تحيات. لقد انتقلت من استضافة سانت بطرسبرغ (لدينا أرخص بكثير، ولا أحد يرسل البريد العشوائي إلى صندوق البريد الذي تم إنشاؤه لمدة نصف ساعة)، لكنني صعدت على أشعل النار - مع MySQL يتم عرضه بدلاً من الحروف الروسية؟؟؟؟؟
قل لي كيف التغلب عليها؟ كتب الاسم بالحروف الروسية - فهمت؟؟؟؟؟ روباس. الترميز هو utf-8 في كل مكان

الجواب: اقرأ kodir.html هناك. هناك أيضًا ثلاث صفحات حول الترميزات. خذ وظائفنا القياسية وقم بالتجربة. على الأرجح هو الإخراج من قاعدة البيانات إلى الفوز 1251، ثم


إذا فهمت بشكل صحيح نقل النقل إلى البطاقة الجديدة \n

إجابة:


صفحة: 1
الصفحة الحالية: 1 إجمالي الرسائل: 6

بعض أحرف HTMLلم يتم تضمينها في الجزء الأساسي من الجدول رموز ASCII. وتشمل هذه الحروف الأبجدية لبعض اللغات الأوروبية والرياضية وبعض الرموز الأخرى. لن يتم تفسير بعض الأحرف التي تم إدخالها في مستند HTML بالشكل الذي أراده المؤلف. هذه هي، على سبيل المثال، الأحرف "" المستخدمة للإشارة إلى العلامات.

إذا كنت بحاجة إلى تحويل العلامات إلى كيانات - استخدم الوظيفة htmlentitiesإذا كانت الكيانات في العلامات - html_entity_decode

وفي هذه الحالات، يمكنك إدخال الأحرف المطلوبة باستخدام رموز خاصة. تبدأ رموز HTML بحرف علامة الضم (&). على سبيل المثال الرمز مساحة غير قابلة للكسريشار إليها باسم ، و رمز القلب- يليه اسم الرمز أو رمزه الرقمي بالنظام العشري أو الست عشري. وينتهي الكود بفاصلة منقوطة (;).

تحدد مواصفات HTML عددًا كبيرًا من الأحرف الخاصة، ولكن يتم استخدام عدد قليل منها فقط. يتم عرض الأحرف الخاصة الأكثر استخدامًا في الجدول:

اسمشفرةمنظروصف
" " " اقتباس مزدوج
& & & علامة العطف
< < أقل من علامة
> > > علامة "المزيد".
مساحة غير قابلة للكسر
¡ ¡ ¡ علامة تعجب مقلوبة
¢ ¢ ¢ سنت
£ £ £ الجنيه الاسترليني
¤ ¤ ¤ الوحدة النقدية
¥ ¥ ¥ ين أو يوان
¦ ¦ ¦ شريط عمودي مكسور
§ § § فقرة
¨ ¨ ¨ علامة تشكيل
© علامة حقوق النشر
ª ª ª البسط الترتيبي المؤنث
« « « قوس الزاوية المزدوجة اليسرى
¬ ¬ ¬ علامة سلبية
- ­ - مكان النقل المحتمل
® ® ® علامة تجارية مسجلة
¯ ¯ ¯ الخط الأفقي العلوي
° ° ° درجة
± ± ± زائد أو ناقص
² ² ² "مربع"
³ ³ ³ "في مكعب"
´ ´ ´ علامة اللكنة
µ µ µ مايكرو
رمز الفقرة
· · · نقطة
¸ ¸ ¸ cedilla (علامة إملائية)
¹ ¹ ¹ مرتفع "واحد"
º º º البسط الترتيبي المذكر
» » » قوس زاوية مزدوج الحق
¼ ¼ ¼ ربع
½ ½ ½ ثانية واحدة
¾ ¾ ¾ ثلاثة أرباع
¿ ¿ ¿ علامة استفهام معكوسة
À À À اللاتينية الكبيرة A مع لهجة منفرجة
Á Á Á العاصمة اللاتينية A بلكنة حادة
   الحرف اللاتيني الكبير A مع علامة التشكيل فوق حرف العلة
à à à العاصمة اللاتينية A مع التلدة
Ä Ä Ä الحرف اللاتيني الكبير A بنقطتين
Å Å Å الحرف اللاتيني الكبير A مع الدائرة العلوية
Æ Æ Æ الحروف اللاتينية الكبيرة AE معًا
Ç Ç Ç اللاتينية العاصمة C مع cedilla
È È È اللاتينية الكبيرة E مع لهجة منفرجة
É É É اللاتينية الكبيرة E مع لهجة حادة
Ê Ê Ê الحرف اللاتيني الكبير E مع علامة التشكيل فوق حرف العلة
Ë Ë Ë الحرف اللاتيني الكبير E بنقطتين
Ì Ì Ì العاصمة اللاتينية I بلكنة منفرجة
Í Í Í العاصمة اللاتينية I بلكنة حادة
Î Î Î الحرف اللاتيني الكبير I مع علامة التشكيل فوق حرف العلة
Ï Ï Ï العاصمة اللاتينية I بنقطتين
Ð Ð Ð اللاتينية العاصمة D مع شرطة
Ñ Ñ Ñ العاصمة اللاتينية N مع التلدة
Ò Ò Ò اللاتينية العاصمة O مع لهجة منفرجة
Ó Ó Ó اللاتينية العاصمة O مع لهجة حادة
Ô Ô Ô الحرف اللاتيني الكبير O مع علامة التشكيل فوق حرف العلة
Õ Õ Õ اللاتينية العاصمة O مع التلدة
Ö Ö Ö الحرف اللاتيني O بنقطتين
× × × علامة الضرب
Ø Ø Ø اللاتينية العاصمة O مع السكتة الدماغية
Ù Ù Ù اللاتينية العاصمة U مع لهجة منفرجة
Ú Ú Ú الحرف اللاتيني الكبير U بلكنة حادة
Û Û Û اللاتينية حرف U مع التشكيل
Ü Ü Ü الحرف اللاتيني الكبير U بنقطتين
Ý Ý Ý اللاتينية العاصمة Y مع لهجة حادة
Þ Þ Þ العاصمة اللاتينية ثورن
à à à الحرف اللاتيني الصغير a بلكنة منفرجة
á #225; á حرف لاتيني صغير "أ" بلكنة حادة
â #226; â اللاتينية الصغيرة مع التشكيل
ã ã ã اللاتينية الصغيرة مع التلدة
ä ä ä الحرف اللاتيني الصغير a بنقطتين
å å å حرف لاتيني صغير a مع دائرة عليا
æ æ æ الحروف اللاتينية الصغيرة أ
ç ç ç اللاتينية حرف صغير ج مع cedilla
è è è الحرف اللاتيني الصغير e مع لهجة منفرجة
é é é الحرف اللاتيني الصغير e بلكنة حادة
ê ê ê اللاتينية الصغيرة ه مع التشكيل
ë ë ë الحرف اللاتيني الصغير e بنقطتين
ì ì ì اللاتينية الصغيرة أنا مع لهجة منفرجة
í í í الحرف اللاتيني الصغير I بلكنة حادة
î î î اللاتينية الصغيرة أنا مع التشكيل
ï ï ï
ð ð ð الأحرف اللاتينية الصغيرة eth
ñ ñ ñ الحرف اللاتيني الصغير N مع التلدة
ò ò ò اللاتينية الصغيرة O مع لهجة منفرجة
ó ó ó اللاتينية الصغيرة O مع لهجة حادة
ô ô ô اللاتينية الصغيرة O مع التشكيل
õ õ õ حرف صغير لاتيني I مع التلدة
ö ö ö الحرف اللاتيني الصغير I بنقطتين
÷ ÷ ÷ علامة القسمة
ø ø ø اللاتينية الصغيرة O مع السكتة الدماغية
ù ù ù الحرف اللاتيني الصغير U مع لهجة منفرجة
ú ú ú الحرف اللاتيني الصغير U بلكنة حادة
û û û اللاتينية حرف صغير U مع التشكيل
ü ü ü الحرف اللاتيني الصغير U بنقطتين
ý ý ý الحرف اللاتيني الصغير Y بلكنة حادة
þ þ þ اللاتينية حرف صغير شوكة
ÿ ÿ ÿ الحرف اللاتيني الصغير Y بنقطتين
ƒ ƒ ƒ علامة وظيفة

رموز للحروف

ˆ ˆ ˆ التشكيل فوق حرف العلة
˜ ˜ ˜ تيلدا

الحروف اليونانية

Α Α Α رأس المال ألفا
Β Β Β بيتا رأس المال
Γ Γ Γ مقياس رأس المال
Δ Δ Δ دلتا رأس المال
Ε Ε Ε العاصمة إبسيلون
Ζ Ζ Ζ زيتا العاصمة
Η Η Η رأس المال هذا
Θ Θ Θ ثيتا العاصمة
Ι Ι Ι ذرة رأس المال
Κ Κ Κ كابا العاصمة
Λ Λ Λ العاصمة لامدا
Μ Μ Μ العاصمة مو
Ν Ν Ν عارية العاصمة
Ξ Ξ Ξ العاصمة الحادي عشر
Ο Ο Ο أوميكرون رأس المال
Π Π Π رأس المال بي
Ρ Ρ Ρ رأس المال رو
Σ Σ Σ سيجما رأس المال
Τ Τ Τ تاو العاصمة
Υ Υ Υ رأس المال أبسيلون
Φ Φ Φ رأس المال فاي
Χ Χ Χ هه رأس المال
Ψ Ψ Ψ رطل لكل بوصة مربعة
Ω Ω Ω أوميغا العاصمة
α α α ألفا صغيرة
β β β بيتا صغيرة
γ γ γ غاما صغيرة
δ δ δ دلتا صغيرة
ε ε ε إبسيلون صغير
ζ ζ ζ زيتا صغيرة
η η η صغيرة هذا
θ θ θ ثيتا صغيرة
ι ι ι ذرة صغيرة
κ κ κ كابا صغيرة
λ λ λ لامدا صغيرة
μ μ μ مو صغيرة
ν ν ν عارية صغيرة
ξ ξ ξ حرف صغير الحادي عشر
ο ο ο أوميكرون صغير
π π π بي صغيرة
ρ ρ ρ رو صغيرة
ς ς ς سيجما صغيرة (نهائي)
σ σ σ سيجما صغيرة
τ τ τ تاو صغيرة
υ υ υ أبسيلون صغيرة
φ φ φ حرف صغير فاي
χ χ χ هيه صغيرة
ψ ψ ψ رطل لكل بوصة مربعة صغيرة
ω ω ω أوميغا صغيرة

علامات الترقيم العامة

- - اندفاعة
اندفاعة م
الاقتباس المفرد الأيسر
اقتباس واحد صحيح
اقتباس واحد أسفل
الاقتباس المزدوج الأيسر
الاقتباس المزدوج الصحيح
الاقتباس المزدوج السفلي

رموز أخرى

الصليب اللاتيني
صليب مزدوج
. . دائرة سوداء صغيرة
علامة الحذف...
علامة جزء في المليون (النسبة المئوية مع صفر إضافي)
ضربة واحدة - دقائق
رئيس مزدوج - ثانية
تراكيب
خفض
اليورو
علامة الرقم
علامة تجارية
المعين
دائرة

السهام

السهم الأيسر
سهم لأعلى
السهم الأيمن
سهم لأسفل
سهم لليسار ولليمين
سهم لأعلى ولأسفل

الدعاوى

البستوني دعوى علامة
علامة البدلة "الأندية"
علامة دعوى القلوب
علامة الدعوى "الماس"
">

السلسلة في PHP هي مجموعة من الأحرف بأي طول. على عكس C، يمكن أن تحتوي السلاسل أيضًا على أحرف فارغة، مما لن يؤثر على البرنامج بأي شكل من الأشكال. بمعنى آخر، يمكن استخدام السلاسل لتخزين البيانات الثنائية. يقتصر طول السلسلة فقط على مقدار ذاكرة الوصول العشوائي المجانية.

في PHP، الحرف هو نفس البايت، مما يعني أن هناك بالضبط 256 حرفًا مختلفًا ممكنًا. وهذا يعني أيضًا أن لغة PHP لا تتمتع بدعم Unicode الأصلي. يتم توفير بعض دعم Unicode من خلال الوظائف utf8_encode()و utf8_decode() .

يمكن معالجة السلسلة بسهولة باستخدام الوظائف القياسية، ويمكنك أيضًا الوصول مباشرة إلى أي من أحرفها.

مثال بسيط لمتغير السلسلة:

$أ= "إنه مجرد نص مخزن في متغير سلسلة";
صدى $a ؛ // المخرجات "هذا مجرد نص مكتوب إلى متغير سلسلة"
?>

الآن دعونا نلقي نظرة على بناء جملة نوع البيانات بالتفصيل. سلسلة للتحويل (.

بناء جملة نوع السلسلة

يمكن تعريف السلسلة بثلاث طرق مختلفة.

إن أبسط طريقة لتعريف سلسلة هي وضعها بين علامات اقتباس مفردة (الرمز " ).

لاستخدام علامة اقتباس واحدة ضمن سلسلة، كما هو الحال في العديد من اللغات الأخرى، يجب أن يسبقها حرف شرطة مائلة عكسية ( \ )، أي: شاشته. إذا كان يجب أن تأتي الشرطة المائلة العكسية قبل علامة اقتباس واحدة أو أن تكون في نهاية السطر، فستحتاج إلى تكرارها. لاحظ أنه إذا حاولت الهروب من أي حرف آخر، فسيتم طباعة الشرطة المائلة العكسية أيضًا! لذلك ليست هناك حاجة عمومًا للهروب من الخط المائل العكسي نفسه.

على عكس النحوين الآخرين، فإن المتغيرات وتسلسلات الهروب للأحرف الخاصة التي تحدث في سلاسل محاطة بـ، لاتتم معالجتها.

فيما يلي مثال لاستخدام علامات الاقتباس المفردة:

صدى "هذه سلسلة بسيطة";

صدى "يمكنك أيضًا الإدراج في السطور
حرف السطر الجديد وبالتالي،
لأنه عادي"
;

// الإخراج: قال أرنولد ذات مرة: "سأعود"
صدى "في أحد الأيام قال أرنولد: "سأعود".";

صدى "هل قمت بحذف C:\\*.*؟";

// المخرجات: هل قمت بحذف C:\*.*؟
صدى "هل قمت بحذف C:\*.*؟" ;

// الإخراج: لن يتم إدراج: \n سطر جديد
صدى "لن يتم إدراج هذا:\nسطر جديد";

// المخرجات: لا يتم استبدال المتغيرين $expand و$
صدى "لا يتم استبدال $expand و$أي من المتغيرات";
?>

إذا كانت السلسلة محاطة بعلامات اقتباس مزدوجة ( " )، يتعرف PHP على المزيد من تسلسلات الهروب للأحرف الخاصة:

جدول تسلسل التحكم:

التبعية معنى
\n السطر الجديد (LF أو 0x0A (10) في ASCII)
\ ص عودة السطر (CR أو 0x0D (13) في ASCII)
\ ر علامة تبويب أفقية (HT أو 0x09 (9) في ASCII)
\\ شرطة مائلة عكسية
\$ علامة الدولار
\" اقتباس مزدوج
\{1,3} سلسلة من الأحرف المقابلة لتعبير عادي، وهو حرف في نظام الأرقام الثماني
\س(1,2) تسلسل من الأحرف المقابلة للتعبير العادي، والحرف في نظام الأرقام الست عشري

دعونا نتذكر مرة أخرى أنه إذا كنت تريد تذكر أي شخصية أخرى، فستتم طباعة الشرطة المائلة العكسية أيضًا!

هناك طريقة أخرى لتحديد السلاسل وهي الاستخدام بناء الجملة هيردوك ("<<< "). بعد<<< необходимо указать идентификатор, затем идет строка, а потом этот же идентификатор, закрывающий вставку.

يجب أن يبدأ معرف الإغلاق في العمود الأول من الصف. بالإضافة إلى ذلك، يجب أن يتبع المعرف نفس قواعد التسمية مثل جميع العلامات الأخرى في PHP: يحتوي فقط على أحرف أبجدية رقمية وشرطة سفلية، ويجب أن يبدأ برقم غير رقمي أو شرطة سفلية.

انتباه! من المهم جدًا ملاحظة أن سطر معرف الإغلاق لا يحتوي على أي أحرف أخرى، باستثناء الفاصلة المنقوطة ( ; ). وهذا يعني أن المعرف وأنه لا يمكن أن يكون هناك أي مسافات أو علامات تبويب قبل أو بعد الفاصلة المنقوطة. من المهم أيضًا أن تفهم أن الحرف الأول قبل معرف الإغلاق يجب أن يكون حرف سطر جديد كما هو محدد بواسطة نظام التشغيل الخاص بك. على سبيل المثال، هذا هو الحال في نظام التشغيل Windows® \ ص.

إذا تم كسر هذه القاعدة ولم يكن معرف الإغلاق "نظيفًا"، فمن المفترض أن معرف الإغلاق مفقود وستواصل PHP البحث عنه بشكل أكبر. إذا لم يتم العثور على معرف الإغلاق الصحيح في هذه الحالة مطلقًا، فسيتسبب ذلك في حدوث خطأ في معالجة رقم السطر في نهاية البرنامج النصي.

هيريدوك-النص يتصرف بنفس الطريقة التي تعمل بها السلسلة في علامات الاقتباس المزدوجة، دون وجودها. هذا يعني أنك لا تحتاج إلى الهروب من علامات الاقتباس في Heredoc، ولكن لا يزال بإمكانك استخدام تسلسل الهروب أعلاه. تتم معالجة المتغيرات، ولكن عليك أن تكون حذرًا عند استخدام المتغيرات المعقدة داخلheredoc كما هو الحال عند العمل مع السلاسل.

مثال على تعريف سلسلة Heredoc:

$ شارع =<<خط المثال،
يغطي عدة خطوط
باستخدام بناء الجملة heredoc.
التخلص من الذخائر المتفجرة؛

/* مثال أكثر تعقيدًا مع المتغيرات. */
فئة فو
{
فار $foo ;
فار $ بار ؛

الدالة فو ()
{
$this -> foo = "Foo" ;
$this -> bar = array("Bar1" , "Bar2" , "Bar3" );
}
}

$foo = جديد foo();
$name = "MyName" ;

صدى<<اسمي "$name". أنا أكتب $foo-> foo.
الآن أنا أستنتج
( $foo -> شريط [ 1 ]) .
يجب أن يؤدي هذا إلى إخراج حرف كبير "A":
\x41
محكمة تكافؤ الفرص؛
?>