ماذا لو أدخلت اللغة الصينية مسافة بين الكلمات عند الكتابة؟ أشياء صغيرة كبيرة كبيرة أو صغيرة.

16

أرغب في جعل البحث عن النص الكامل في MySQL يعمل مع النصوص اليابانية والصينية، بالإضافة إلى أي لغة أخرى. المشكلة هي أن هذه اللغات، وربما لغات أخرى، لا تحتوي عادةً على مسافة بين الكلمات. لا يكون البحث مفيدًا عندما يتعين عليك إدخال نفس الجملة كما في النص.

لا أستطيع أن أضع مسافة بين كل حرف لأن اللغة الإنجليزية يجب أن تعمل أيضًا. أرغب في حل هذه المشكلة باستخدام PHP أو MySQL.

هل يمكنني تكوين MySQL للتعرف على الأحرف التي يجب أن تكون فهارسًا خاصة بها؟ هل هناك وحدة PHP يمكنها التعرف على هذه الأحرف حتى أتمكن من إزالة المسافات حول الفهرس؟

الحل الجزئي:

$string_with_spaces = preg_replace("/[".json_decode(""\u4e00""."-".json_decode(""\uface""."]/", " $0 ", $string_without_spaces);

وهذا يجعل فئة الشخصية على الأقل من بعض الشخصيات التي أحتاج إلى معالجتها على وجه التحديد. ربما يجب أن أذكر أنه من المقبول تخطي النص المفهرس.

هل يعرف أحد جميع نطاقات الأحرف التي سأحتاج إلى إدراجها في المسبار؟

أيضًا، هل يجب أن تكون هناك طريقة محمولة أفضل لتمثيل هذه الأحرف في PHP؟ الكود المصدري في Literal Unicode ليس مثاليًا؛ لا أتعرف على جميع الشخصيات؛ وقد لا تظهر على جميع الأجهزة التي أحتاج إلى استخدامها.

3

اللغات الحديثة الأخرى التي لا تستخدم مسافات بين الكلمات هي التايلاندية، اللاوية، الخميرية (الكمبودية)، والبورمية (ميانمار). في اللغة الفيتنامية، هناك مشكلة ذات صلة وهي استخدام المسافات بين جميع المقاطع باستثناء الكلمات الأجنبية. - hippietrail 18 ديسمبر 10 2010-12-18 12:48:10

  • 2 إجابات
  • فرز:

    نشاط

15

تتطلب انتهاك الكلمات للغات المذكورة النهج اللغوي ، على سبيل المثال الذي يستخدم قاموسجنبا إلى جنب مع فهم الأساسية القواعد الناشئة.

لقد سمعت عن تطبيقات بحث عن النص الكامل ناجحة نسبيًا والتي تقوم ببساطة بفصل كل حرف على حدة ككلمة منفصلة باللغة الصينية، ببساطة تطبيق نفس "الترميز" لمعايير البحث المقدمة من قبل المستخدمين النهائيين. يوفر محرك البحث بعد ذلك تصنيفات أفضل للمستندات التي توفر أحرف الكلمات بنفس ترتيب معايير البحث. لست متأكدًا مما إذا كان من الممكن توسيع هذا ليشمل لغات مثل اليابانية، نظرًا لأن مجموعات أحرف هيراكانا وكاتاجانا تجعل النص أكثر تشابهًا مع اللغات الأوروبية ذات الحروف الأبجدية القصيرة.

يحرر:
موارد
هذه الكلمة هي لتحليل المشاكل، وكذلك القضايا ذات الصلة، لذلك غير تافهةأن الكتب بأكملها قد كتبت عن ذلك. انظر على سبيل المثال معالجة معلومات CJKV (تشير CJKV إلى اللغات الصينية واليابانية والكورية والفيتنامية، ويمكنك أيضًا استخدام الكلمة الأساسية CJK نظرًا لأن العديد من النصوص لا تناقش اللغة الفيتنامية). راجع أيضًا يعد كسر الكلمات باللغة اليابانية أمرًا صعبًا بالنسبة لصفحة واحدة حول هذا الموضوع.
ومن الواضح أن معظم المواد التي تغطي هذا الموضوع مكتوبة بإحدى اللغات الرئيسية في اللغة الأم وبالتالي فهي تقتصر على الأشخاص الذين ليس لديهم إتقان نسبي لهذه اللغات. لهذا السبب، ولمساعدتك في اختبار محرك البحث، بمجرد البدء في تنفيذ منطق فاصل الكلمات، يجب عليك طلب المساعدة من متحدث أصلي أو اثنين.

أفكار مختلفة
فكرتك تحديد الميزات التي تشير بشكل منهجي إلى فاصل الكلمات(على سبيل المثال، علامات الاقتباس والأقواس والرموز الشبيهة بالواصلات وما إلى ذلك) جيدة، وربما يكون هذا أحد الاستدلالات المستخدمة في بعض فواصل الكلمات الاحترافية. ومع ذلك، يجب عليك البحث عن مصدر حسن السمعة لمثل هذه القائمة بدلاً من تجميعها من الصفر بناءً على النتائج المتناقلة.
الفكرة ذات الصلة هي تقسيم الكلمات إلى التحولات كانا إلى كانجي(لكنني لا أظن العكس)، وربما في هيراغانا إلى كاتاكاناأو العكس من التحولات.
لا علاقة له بالحرف الصحيح المكسور، قد يستفيد الفهرس [-أو لا-؛-)] من التحويل المنهجي لكل حرف هيراغانا، على سبيل المثال، إلى حرف كاتاكانا المقابل. مجرد فكرة غير متعلمة! لا أعرف ما يكفي عن اللغة اليابانية لأعرف ما إذا كان هذا سيساعد أم لا؛ بديهيًا، سيكون هذا مرتبطًا بشكل فضفاض بالتحويل المنهجي للحروف المحركة وبالتالي إلى نص مناظر غير معلم، كما هو متبع في العديد من اللغات الأوروبية.

ربما يمكن تعديل الفكرة التي ذكرتها سابقًا والتي تتمثل في فهرسة الأحرف الفردية بشكل منهجي (وترتيب نتائج البحث بناءً على تقريبها لمصطلح البحث) بشكل طفيف، على سبيل المثال عن طريق الاحتفاظ بأحرف كانا المتتالية معًا ثم بعض القواعد الأخرى... وإنشاء ناقص، ولكن محرك بحث عملي للغاية.

لا تصاب بخيبة أمل إذا لم يكن الأمر كذلك... كما ذكرنا، هذا ليس بالأمر التافه، ويمكن أن يوفر لك الوقت والمال على المدى الطويل من خلال التوقف وقراءة كتاب أو كتابين. سبب آخر لمحاولة معرفة المزيد عن "النظرية" وأفضل الممارسات هو أنك تبدو أنك تركز عليها في الوقت الحالي كلمات المخالفة ولكن في المستقبل القريب قد يستفيد محرك البحث أيضًا الوعي التبعي ; في الواقع، هذين السؤالين لهما صلة لغويًا على الأقل، وقد يكونا مفيدًا عند معالجتهما جنبًا إلى جنب.

حظا سعيدا لك في هذا المسعى غير السار ولكنه يستحق.

0

@جو: مرحبًا بك. يبدو أن لدي اهتمامًا باللغويات والبرمجة اللغوية العصبية، لكن معرفتي الخاصة بلغات CJK قليلة جدًا. اقرأ تعديلي بإضافة بعض الكلمات الرئيسية والروابط عبر الإنترنت التي قد تساعدك في بحثك. - com.mjv 22 أكتوبر 09

علامات الترقيم هي جزء لا يتجزأ من أي لغة. يمكن للفاصلة العادية أن تغير معنى الجملة بشكل جذري: فقط تذكر قصة "لا يمكن العفو عن الإعدام". ويتطلب عمل المترجمين والمحررين أن يتقنوا نظامين من أنظمة الترقيم على الأقل.

ولدت فكرة هذا المنشور عندما كنا نناقش ترجمة مقال. في المادة المصدر، تم فصل علامة النسبة المئوية بمسافة عن الرقم، وهذا ما لفت انتباهي - في النص الروسي في هذه الحالة، لا يتم استخدام المسافة (على الرغم من أن العبارة لا تزال مثيرة للجدل - لم يتوصل الخبراء إلى حل) الإجماع على هذه المسألة). ثم قررنا أننا بحاجة للحديث عن ذلك. أجرى متخصصون من قسم التعريب متعدد اللغات مقابلات مع زملائنا الأجانب وأعدوا المواد التي نشاركها معك الآن. نأمل أن تجدها مفيدة.

في البداية وفي النهاية

دعونا نرى كيف تسير الأمور مع وضع علامات الترقيم في الجملة: النقاط والفواصل والنقطتين والفواصل المنقوطة وعلامات الاستفهام وعلامات التعجب.

نأمل أن يتذكر الجميع اللغة الروسية - يتم وضع علامات الترقيم التي تفصل الجمل عن بعضها البعض في نهاية الفترة فقط. إذا كنت بحاجة إلى إضافة تعبير (خاصة في المراسلات الشخصية)، فسيتم استخدام مجموعات من الأحرف - "!!!"، "؟!" وما شابه. في اللغات الإنجليزية والألمانية والإيطالية والفرنسية والكندية والعربية والبرتغالية البرازيلية، تتبع النقاط وعلامات الحذف و"رفاقها" نفس القواعد.

قواعد أخرى باللغة الفرنسية: النقطتان والفواصل المنقوطة وعلامات التعجب وعلامات الاستفهام مسبوقة بمسافات غير منقسمة.

الإسبانية هي اللغة الوحيدة في اختيارنا التي تحدد فيها علامات الترقيم الجمل: في بداية العبارة، يتم تكرار علامات الاستفهام والتعجب في شكل مقلوب "قليلاً" - "¿" و"¡".

لدى الصينيين النهج الأكثر غرابة في التعامل مع علامات الترقيم من وجهة نظر أوروبية. تبدو النقطة الخاصة بهم مثل .، والفاصلة تبدو مثل،، وعلامة التعجب تبدو مثل،، وعلامة الاستفهام تبدو مثل ?. في الجملة، يتصرفون مثل نظرائهم الروس، والفرق الوحيد هو أن الصينيين لا يستخدمون المسافات، لأن جميع أحرف الترقيم مزدوجة البايت. يبلغ عرض الكتابة الهيروغليفية المكتوبة على لوحة المفاتيح ضعف عرض أي حرف من الأبجدية اللاتينية. ولذلك، فإن علامات الترقيم عادة ما تشغل نفس المساحة التي يشغلها الحرف الهيروغليفي. تمت مواجهة هذه الميزة من قبل أولئك الذين عملوا في محررات أسلوب الإدخال القديمة التي تعمل بنظام DOS، عندما تمت إزالة الهيروغليفية التي تم إدخالها بشكل غير صحيح عن طريق الضغط على مسافة للخلف مرتين. تُستخدم المسافات بشكل أساسي لفصل الكلمات والأحرف عن اللغات الأخرى، مثل اللغة الإنجليزية.

ميزات لطيفة

في اللغة الروسية، يتم استخدام الواصلة أو الشرطة. الواصلة قصيرة وهي ضرورية لنقل الكلمات المركبة وربطها. الشرطة أطول بكثير. فهو يعمل على فصل الأجزاء الدلالية: جمل مختلفة، وجزأين من جملة واحدة، في الحوارات، وما إلى ذلك. يمكنك تذكر كل التفاصيل الدقيقة لاستخدام هذه العلامات من خلال النظر في كتاب مدرسي للغة الروسية.

توجد الواصلات والشرطات في ظروف مماثلة باللغات الإنجليزية والألمانية والفرنسية والبرتغالية البرازيلية. في الوقت نفسه، في اللغة الإنجليزية الأمريكية، يتم فصل الشرطة على كلا الجانبين بمسافات، ولكن في اللغة الإنجليزية البريطانية لا يتم ذلك عادةً:

وستضم المحاضرة – وهي الثالثة حول هذا الموضوع هذا الشهر – متحدثين من دول مختلفة. (الإنجليزية الأمريكية)

كانت حديقة الحيوان تحتوي على عدد كبير جدًا من القطط - الأسود والفهود والنمور والجاغوار والفهود - مما جعل اختيار القطط المفضلة أمرًا صعبًا للغاية. (الإنجليزية البريطانية)

في الإسبانية والإيطالية والعربية، تبدو الواصلات والشرطات متماثلة: "-". لا يستخدم الصينيون الواصلات على الإطلاق، بل لديهم شرطات فقط. على الرغم من أنه بجانب الحروف من الأبجدية اللاتينية قد تكون هناك واصلات وشرطات طويلة وشرطات متوسطة. الواصلة قصيرة وهي ضرورية لنقل الكلمات المركبة وربطها. الشرطة أطول بكثير. إنه يعمل على فصل الأجزاء الدلالية

اللغات واصلة شرطة إم (Alt 0151)
الروسية
الإنجليزية الأمريكيةنعم، للواصلة وضم الكلمات المركبةنعم، لفصل الأجزاء الدلالية: جمل مختلفة، جزأين من جملة واحدة، في الحوارات، الخ.
إنجليزي
بريطانية
نعم، للواصلة وضم الكلمات المركبةنعم، لفصل الأجزاء الدلالية: جمل مختلفة، جزأين من جملة واحدة، في الحوارات، الخ. غير مفصولة بمسافات على كلا الجانبين.
الألمانيةنعم، للواصلة وضم الكلمات المركبةنعم، لفصل الأجزاء الدلالية: جمل مختلفة، جزأين من جملة واحدة، في الحوارات، الخ.
فرنسينعم، للواصلة وضم الكلمات المركبةنعم، لفصل الأجزاء الدلالية: جمل مختلفة، جزأين من جملة واحدة، في الحوارات، الخ.
كندي فرنسينعم، للواصلة وضم الكلمات المركبةنعم، لفصل الأجزاء الدلالية: جمل مختلفة، جزأين من جملة واحدة، في الحوارات، الخ.
الأسبانيةنعم في جميع الحالات-
البرتغالية
برازيلية
نعم، للواصلة وضم الكلمات المركبةنعم، لفصل الأجزاء الدلالية: جمل مختلفة، جزأين من جملة واحدة، في الحوارات، الخ.
ايطالينعم في جميع الحالات-
عربينعم في جميع الحالات-
الصينيةفقط بجانب الحروف من الأبجدية اللاتينيةنعم في جميع الحالات
نوع الرسالة المقترن


توجد علامات الاقتباس في جميع اللغات، ولكنها تبدو مختلفة، مثل الأزياء الوطنية. في اللغة الروسية هناك كل من "أشجار عيد الميلاد" التقليدية، والتي جاءت من الفرنسية، و"الكفوف" الألمانية، والتي تستخدم في العبارات داخل علامات الاقتباس وعند الكتابة باليد. تستخدم الإسبانية والبرتغالية البرازيلية والإيطالية والعربية علامات الاقتباس المزدوجة.

يستخدم الإنجليز علامتي الاقتباس "المفردة" و"المزدوجة": الأولى للعناوين والثانية للاقتباس. النقاط والفواصل موجودة داخل علامات الاقتباس. يوجد في النص الفرنسي "خطوط متعرجة"، مع اختلاف واحد عن النص الروسي: هناك مسافة متصلة بين بداية النص المقتبس وعلامة الاقتباس المفتوحة، وكذلك بين نهاية العبارة وعلامة الاقتباس الختامية.

هناك ثلاثة أنواع من علامات الاقتباس في اللغة الصينية، والتي تخدم أغراض مختلفة. هذه هي أسماء الكتب والأفلام وغيرها من أعمال التأليف. بالنسبة لجميع الحالات الأخرى، يستخدم الصينيون 「مثل」. لا يمكن العثور على علامات الاقتباس من التقليد الأوروبي (سواء "أشجار عيد الميلاد" أو "الكفوف" أو "مفردة" أو "مزدوجة") إلا في الترجمات أو بالاقتران مع عبارات من اللغات الأوروبية. لم تكتسب شعبية في اللغة الصينية التقليدية.

توجد علامات الاقتباس في جميع اللغات، ولكنها تبدو مختلفة، مثل الأزياء الوطنية.

اللغات«…» „…“ “…” ‘…’ 《…》 「…」
الروسيةالقياسية والفترات والفواصل خارجالبدائل في العبارة داخل علامات الاقتباس وعند الكتابة باليدالبدائل عند الكتابة باليد- - -
إنجليزي
أمريكي
- - المعيار للعناوين- -
إنجليزي
بريطانية
- - قياسي عند الاقتباس والنقاط والفواصل بالداخلالمعيار للعناوين- -
الألمانية- معيار- - - -
فرنسيمسافة قياسية غير منقسمة قبل علامات الاقتباس الافتتاحية والإغلاقية- - - - -
الأسبانية- - معيار- - -
البرتغالية
برازيلية
- - معيار- - -
ايطالي- - معيار- - -
عربي- - معيار- - -
الصينيةفقط في الترجمات أو بالاشتراك مع عبارات من اللغات الأوروبيةفقط في الترجمات أو بالاشتراك مع عبارات من اللغات الأوروبيةفقط في الترجمات أو بالاشتراك مع عبارات من اللغات الأوروبيةمعيار عناوين الكتب والأفلام وأعمال التأليف الأخرىالمعيار للحالات الأخرى
رمزية

النسب المئوية وجزء في المليون ليست أيضًا قياسية بشكل خاص. في الألمانية والفرنسية والإسبانية، يجب فصل هذه الأحرف بمسافات غير منقسمة. وباللغات الروسية والإنجليزية والإيطالية والعربية والبرتغالية البرازيلية، اكتب مباشرة بعد الرقم. على الرغم من أن الوضع غامض بالنسبة للروس كما نتذكر.

عادة ما يتم وضع الدرجات والبوصات بعد الرقم دون أي مسافات.

حقيقة مثيرة للاهتمام: عندما يكتب الفرنسيون أرقامًا كبيرة، فإنهم يفصلون بين الكتل المكونة من ثلاثة أرقام بمسافات - على سبيل المثال: 987,654,321.12.

لدى الصينيين أحرفهم الخاصة للدرجات (度) والنسب المئوية (百分比 و百分之). ومع ذلك، يتم استخدام ° و٪ المعتاد معهم دون وجود مسافات أمامهم.

إقامة الحوار

يختلف تنسيق الحوار أيضًا من لغة إلى أخرى. في اللغة الروسية، نضع شرطة م قبل كل سطر. المتحدثون باللغة البرتغالية البرازيلية يفعلون نفس الشيء.

في اللغة الإنجليزية، يتم استخدام علامات الاقتباس "المزدوجة" و"المفردة"، على سبيل المثال:

قالت مارينا وهي تعطي سيمون حقيبة: «هذا مليون جنيه.»

وتابعت مارينا: "لقد تحدثت مع إيفان وقال: "سايمون يطلب عشرة ملايين، لكن هذا كثير جدًا".

في اللغة الألمانية، يتم تنسيق الحوارات أيضًا باستخدام علامات الاقتباس التقليدية - "الكفوف". يضع الفرنسيون "خطوط متعرجة"، وكذلك شرطات قصيرة، في الحالات التي يتغير فيها مؤلف السطر. تتخلل أجزاء من الحوار شرطات باللغة الإسبانية أيضًا.

تستخدم الإيطالية والعربية علامات الاقتباس المزدوجة المستقيمة للحوار.

عادة ما يضع الصينيون فقط "علامات الاقتباس" أو ما يعادلها باللغة الإنجليزية في حوارهم.

كبيرة أو صغيرة


في اللغات الإنجليزية والفرنسية والإسبانية والبرتغالية البرازيلية والإيطالية، كل شيء بسيط ومألوف للمتحدثين باللغة الروسية - تُستخدم الأحرف الكبيرة في بداية الجمل للاختصارات وأسماء الأعلام.

اللغة الألمانية أكثر متعة. الأسماء والأسماء والألقاب، والصيغة المهذبة للعنوان (Sie) في جميع أشكال الحالات (Ihr، Ihre، Ihrer، Ihres، Ihrem، Ihren) مكتوبة بحرف كبير. الصفات والمشاركين ومصادر المصدر المستخدمة في الجملة كأسماء مع أداة محددة (das Gute) أو غير محددة (ein Lächeln)، أو حرف الجر (في Blau)، أو الضمير (dein Stottern)، أو العدد (nichts Aufregendes) أو الصفة في شكل مقلوب (lautes Sprechen). فقط كل شيء :-)

لا تميز الأبجدية العربية بين الأحرف الصغيرة والكبيرة، ولكن معظم الحروف لها هجاءان أو ثلاثة أو أربعة تهجئات مختلفة: لبداية الكلمة ووسطها ونهايتها، وأحيانًا لحرف واحد خارج الكلمة. لقد تطور موقف مماثل في اللغة الصينية - فمن غير المرجح أن يكون من الممكن التمييز بين الأحرف الصغيرة أو الكبيرة. وإذا احتاج المؤلفون الصينيون إلى تسليط الضوء على جزء ما من النص، فإنهم يضعون تحته خطًا أو يستخدمون الخط الغامق.

أي شخص عمل في مشروع من الصين أو أطلق حملة هناك يعرف أن فكرة التصميم المحلية تختلف عن الفكرة الغربية. لا تحتاج إلى البحث بعيدًا عن الأمثلة - إذا كنت تعمل لدى علامة تجارية دولية في الصين أو تنشئ منتجًا يتم بيعه هناك، فابحث في Baidu.com أو QQ.com لترى كيف يتم تمثيل علامتك التجارية في السوق الصينية عبر الإنترنت فضاء.

الفرق الأكبر هو أن مواقعهم تبدو مزدحمة للغاية. الكثير من النصوص والروابط وحتى الرسوم المتحركة التي تبدو مصممة لجعل الصفحة مستحيلة القراءة.

قد يبدو الأمر وكأنه فوضى رقمية، لكن المواقع الصينية مصممة بهذه الطريقة لعدة أسباب. إذا كنت تخطط لبدء عملك في الصين، فننصحك بتعلم بعض من تجارب الويب المحلية.

اللغة الصينية مختلفة تماما

أولاً، إليك بعض الحقائق التي يجب أن تعرفها:

1. لا توجد أحرف كبيرة باللغة الصينية. يتم تدريب القراء الغربيين على التعرف على الحروف الكبيرة في النص للعثور على بداية الجملة ونهايتها. ولهذا السبب يمكن أن تبدو المواقع الصينية وكأنها مجموعة من الشخصيات المتشابهة

2. لا توجد مسافات بين الأحرف. تستخدم اللغات الغربية المسافات للفصل بين الكلمات، وهو أمر لا تفعله اللغة الصينية أيضًا. هنا، سلسلة طويلة من الأحرف أمر طبيعي تمامًا، بينما بالنسبة للمستخدمين الغربيين يكون الأمر مربكًا

3. هل فعلت بعض العجين؟من حيث المبدأ، كل شيء واضح، أليس كذلك؟ من السهل قراءة الكلمات ذات الحروف المعكوسة طالما أن الحرف الأول والأخير في مكانهما الصحيح وطالما لم تتم كتابتهما بشكل عكسي تمامًا. ولهذا السبب، يتصفح الأشخاص النص بأعينهم بدلاً من قراءة كل كلمة. ولكن بما أنهم لا يستطيعون قراءة النصوص الصينية بنفس الطريقة (على افتراض أن الحروف غير مألوفة بالنسبة لهم)، فإن سطور هذه الأحرف تبدو فوضوية بشكل خاص بالنسبة لهم.

4. الحروف الصينية أكثر "كثافة" من الحروف اللاتينية أو السيريلية - 10 خطوط في حرف واحد في المتوسط ​​مقابل واحدة أو اثنتين. ولهذا السبب، يبدو النص الصيني مرة أخرى "مثقلًا" بالنسبة للمستخدم الغربي.

الميزة المحيرة التالية هي أن موقع الويب الصيني النموذجي يبدو كرابط واحد كبير. على موقع Sohu.com، كل شخصية حرفيًا هي جزء من رابط.

هناك نظريتان حول هذا. الأول هو أن الحروف الصينية يصعب كتابتها على لوحة المفاتيح الأبجدية، لذا بدلاً من استخدام مربع البحث، يميل المستخدمون إلى النقر على الروابط.

يعد هذا أمرًا معقولًا تمامًا نظرًا لأن كتابة الأحرف الصينية تتضمن إما رسم أحرف أو استخدام أحرف غربية لنسخ نظام الكتابة بينيين.

بعد كتابة الهيروغليفية أو طباعة نسخها، تظهر خيارات الرمز، والتي يجب على المستخدم اختيار الخيار الصحيح منها. يبدو أن القيام بذلك مرارًا وتكرارًا للبحث أمر صعب للغاية.

ولكن هناك نظرية أخرى. ونظراً لشعبية محرك البحث بايدو، الذي يقدم المعادل الصيني لبحث جوجل، فهناك من الأسباب ما يجعلنا نعتقد ذلك. ووفقا لهذه النظرية، لا يزال العديد من الصينيين يستخدمون الإنترنت منخفض السرعة. وتؤكد إحصائيات دراسة Akamai ذلك.

النسبة المئوية لمستخدمي الإنترنت حسب البلد وسرعة الإنترنت: أقل من 4 ميجابايت/ثانية، أكثر من 4 ميجابايت/ثانية، أقل من 10 ميجابايت/ثانية، أكثر من 10 ميجابايت/ثانية

كما ترون، يستخدم ثلثا الشعب الصيني الإنترنت بسرعات اتصال أقل من 4 ميجابت في الثانية - وهذا أقل بكثير من متوسط ​​السرعة العالمية ولم يُسمع به تقريبًا في الدول الغربية.

خلاصة القول، مع سرعات الإنترنت البطيئة نسبيًا، فمن المنطقي تحميل صفحة واحدة تحتوي على الكثير من الروابط ثم فتحها في علامات تبويب جديدة. يتيح ذلك للمستخدمين تصفح الصفحات بالتوازي بدلاً من الاضطرار إلى الانتظار لفترة طويلة لتحميل الصفحات واحدة تلو الأخرى. أولئك الذين يتذكرون اتصالات الإنترنت عبر الطلب الهاتفي سيفهمون ما نتحدث عنه.

أخيرًا، تستخدم مواقع الويب الصينية الكثير من النصوص واللافتات الوامضة.

ويبدو أن السبب هو صعوبة جذب الانتباه باستخدام خطوط مختلفة باللغة الصينية مقارنة بالنصوص الغربية. و هناك عدة أسباب لذلك، منها:

1. لا يوجد سوى عدد قليل من الخطوط للأحرف الصينية.
2. الحروف المائلة غير موجودة، ولا يتم استخدام الخط الغامق عادةً.
3. الحد الأدنى لحجم الخط - 12 بكسل

علاوة على ذلك (وهنا ننتقل إلى العنصر الثقافي)، يبدو أن الصينيين ببساطة يهتمون بشكل أقل بالرسومات الوامضة مقارنة بالغربيين. ونتيجة لذلك، فإن ما يبدو لنا مثقلًا هو أمر طبيعي بالنسبة لهم.

علاوة على ذلك، مع ظهور النوافذ المنبثقة على المواقع الغربية، لم تعد الموارد الصينية تبدو مختلفة عنها كما كانت في السابق.

ختاماً

تعتبر اللغة الصينية من أقدم اللغات المكتوبة في العالم. يعود تاريخها إلى ما لا يقل عن 3 آلاف سنة. تم العثور على نقوش عليه على صدف السلاحف من عهد أسرة شانغ (1766-1123 قبل الميلاد).

تاريخ الكتابة الصينية

الكتابة الصينية أحدث من الكتابة السومرية أو المصرية، لكن لا يوجد دليل على أن اختراع الكتابة في الدولة الوسطى تم تحفيزه بأي شكل من الأشكال من خلال الكتابة في الشرق الأدنى. أقدم الأمثلة على الحروف الصينية هي نصوص العرافة على العظام والأصداف. وهي تتكون من سؤال للعراف وإجابة عليه. تُظهر هذه الكتابة المبكرة أنها كانت تعتمد في أيامها الأولى على الصور التوضيحية. على سبيل المثال، تم تصوير كلمة "بقرة" برأس حيوان، وتم تصوير "المشي" بصورة قدم.

ومع ذلك، بمرور الوقت، خضعت الكتابة الصينية للعديد من التغييرات، وبحلول الوقت (206 ق.م. - 220 م) فقدت معظم رمزيتها. تشكلت الكتابة الهيروغليفية الحديثة خلال القرنين الثالث والرابع الميلادي. ه. والمثير للدهشة أنهم ظلوا بعد ذلك دون تغيير تقريبًا. بالإضافة إلى النماذج القياسية، هناك أيضًا العديد من النماذج المكتوبة بخط اليد. الأكثر شيوعًا هي Tsaoshu و Xingshu. النوع الأول صعب جدًا قراءته للأشخاص الذين ليس لديهم تدريب خاص. Xingshu هو نوع من التسوية بين السرعة العالية لـ caoshu والكتابة القياسية. يستخدم هذا النموذج على نطاق واسع في الصين الحديثة.

كم عدد الحروف الموجودة باللغة الصينية؟

لتمثيل كل مقطع في المفردات، يستخدم الصينيون أحرفًا مميزة واحدة. الغالبية العظمى من العلامات عبارة عن نسخ مكتوبة من الأصوات المنطوقة التي لها معنى دلالي. على الرغم من أن نظام الكتابة قد تغير مع مرور الوقت بسبب الثورات والاضطرابات السياسية، إلا أن مبادئه ورموزه ظلت في الأساس كما هي.

كانت أحرف الكلمات الصينية تصور في الأصل الأشخاص أو الحيوانات أو الأشياء، ولكن مع مرور القرون أصبحت منمقة بشكل متزايد ولم تعد تشبه ما تمثله. وعلى الرغم من أن هناك حوالي 56 ألفًا منهم، إلا أن الغالبية العظمى منهم غير معروفة للقارئ العادي - فهو يحتاج إلى معرفة 3000 منهم فقط ليكون متعلمًا. ربما يجيب هذا الرقم بشكل أكثر موثوقية على السؤال حول عدد الأحرف الموجودة في اللغة الصينية.

الشعارات المبسطة

أدت مشكلة تعلم آلاف الحروف عام 1956 إلى تبسيط كتابة الحروف الصينية. ونتيجة لذلك، أصبح حوالي 2000 شعارًا أسهل في القراءة والكتابة. يتم تدريسهم أيضًا في فصول لغة الماندرين في الخارج. هذه الرموز أبسط، أي أنها تحتوي على عناصر رسومية أقل من تلك التقليدية.

الحروف المبسطة موجودة منذ مئات السنين، ولكن تم دمجها رسميًا في الكتابة فقط بعد تأسيس جمهورية الصين الشعبية في الخمسينيات لتحسين معرفة القراءة والكتابة. يتم استخدام الشعارات المبسطة من قبل صحيفة الشعب اليومية People's Daily وتستخدم في ترجمات الأخبار ومقاطع الفيديو. ومع ذلك، فإن الأشخاص الذين يكتبون بشكل صحيح قد لا يعرفون النسخة التقليدية.

هذا النظام هو المعيار في جمهورية الصين الشعبية (باستثناء هونغ كونغ) وسنغافورة، ولا تزال اللغة الصينية التقليدية هي المعيار في هونغ كونغ وتايوان وماكاو وماليزيا وكوريا واليابان وبلدان أخرى.

حرف صوتي

طور المتحدثون الكانتونيون نظامهم الخاص من العلامات الصوتية. تُستخدم هذه الأحرف بالإضافة إلى الأحرف الصينية التقليدية، على سبيل المثال في الكتب المصورة أو الأقسام الترفيهية في الصحف والمجلات. في كثير من الأحيان لا يمكن العثور على هذه الحروف الهيروغليفية في القاموس. يتم استخدام الشعارات غير الرسمية للنقل

بينيين

في محاولة لجعل اللغة الصينية أكثر قابلية للفهم لدى الغرب، طورت الصين نظام بينيين. يتم استخدامه لنقل الكلمات في عام 1977، قدمت سلطات جمهورية الصين الشعبية طلبًا رسميًا إلى الأمم المتحدة لتسمية الأماكن الجغرافية في الصين باستخدام نظام بينيين. يتم استخدام نظام Pinyin من قبل أولئك الذين هم أكثر دراية بالأبجدية اللاتينية ويتعلمون التحدث باللغة الصينية.

فوائد إدخال المسافات عند الكتابة باللغة الصينية

1. تحسين إمكانية القراءة: تؤدي إضافة حدود الكلمات إلى تقليل العبء المعرفي عند قراءة النص الصيني. إذا كان النص مكتوبًا بدون مسافات، يحتاج القارئ إلى تحليل أين تبدأ الكلمات وتنتهي، بينما يحاول في نفس الوقت فهم معنى النص، مما يعقد مهمة صعبة بالفعل.

2. معالجة آلية أكثر دقة للنصوص المكتوبة باللغة الصينية: قبل البدء في معالجة النص الصيني، يجب أولاً تقسيم النص. هذه ليست مهمة سهلة عند معالجة اللغات التي تستخدم الكتابة الهيروغليفية. هناك طرق آلية سريعة ليست دقيقة جدًا (~90%)، وهناك طرق بطيئة أكثر دقة (~94-97%)، ولكن لا توجد طريقة مثالية.
إذا كانت الكتابة الصينية بها مسافات بين الكلمات، فلن تكون هناك حاجة للتجزئة، وستصبح المعالجة الآلية للنص الصيني أسهل بكثير. ونتيجة لذلك، سيتم تبسيط مهمة الترجمة من اللغة الصينية بشكل كبير.

3. جعل تعلم اللغة الصينية أسهل للطلاب: المسافات بين الكلمات تجعل الكلمات والجمل أسهل في الفهم. عندما بدأت تعلم اللغة الصينية لأول مرة، قضيت الكثير من الوقت في البحث عن كلمات غير موجودة في القاموس لأن عدم وجود مسافات بين الكلمات جعل من الصعب فهم حدود الكلمات باللغة الصينية. إن إدخال مسافات بين الكلمات من شأنه أن يسمح لمتعلمي اللغة الصينية ببناء المفردات بشكل أسرع وأكثر كفاءة.

لماذا لا يحتاج النص الصيني إلى مسافات بين الكلمات؟

1. ما هي الكلمة؟ مفهوم "الكلمة" باللغة الصينية غامض للغاية. أين تبدأ الكلمة وتنتهي؟ سؤال بسيط لمتحدث اللغة الروسية (وأي لغة أخرى تعتمد على الأبجدية) يمكن أن يربك المتحدث الأصلي للغة الصينية. على سبيل المثال، هل يجب اعتبار الجسيم 了، الذي يشير إلى الزمن الماضي، جزءًا من الكلمة؟
على سبيل المثال، في الجملة 小刘来了 أين تضع مسافة - 小刘_来了 أو 小刘来_了? بالنسبة للمتحدثين الصينيين أنفسهم، الذين لم يعتادوا على قراءة النصوص التي بها مسافات بين الكلمات، فإن إدخال المسافات لن يؤدي إلا إلى تعقيد الأمر فهم اللغة المكتوبة.

2. التقليد: الكتابة الصينية موجودة منذ أكثر من 3000 عام، وخلال هذه الفترة لم يتم إدخال المسافات بين الكلمات. لماذا التعريف بهم الآن؟

3. يبدو النص الصيني أكثر جمالا بدون مسافات بين الكلمات. إن إدخال المساحات من شأنه أن يسهل على المتعلمين الصينيين الفهم، ولكن لن يقوم أحد بتكييف نظام اللغة بما يناسب أولئك الذين يتعلمونها للتو.

ملاحظة: 1.النصوص الأوروبية القديمة أيضًا لم تكن تحتوي على مسافات بين الكلمات.

ملاحظة: 2:في اللغة الروسية، هناك حاجة إلى مسافات، لأنه بدونها يتغير معنى العبارة.
قارن: الأشياء السخيفة وحمل الأشياء المختلفة.

ملاحظة: 3.:كما يمكن للمتحدث الأصلي فهم النص الروسي تمامًا إذا كان مكتوبًا بدون مسافات. في البداية يكون من الصعب فهمه، ولكن بعد ذلك يتكيف دماغنا...