វិធីសរសេរនិងតេស្តតម្រង Regex សំរាប់ Google Analytics (ជាមួយឧទាហរណ៍)
ដូចគ្នានឹងអត្ថបទរបស់ខ្ញុំជាច្រើននៅទីនេះខ្ញុំធ្វើការស្រាវជ្រាវខ្លះសម្រាប់អតិថិជនហើយបន្ទាប់មកសរសេរអំពីវានៅទីនេះ។ និយាយដោយស្មោះត្រង់មានហេតុផលមួយចំនួនដែល…ដំបូងគឺថាខ្ញុំមានការចងចាំដ៏គួរឱ្យភ័យខ្លាចហើយជារឿយៗស្រាវជ្រាវគេហទំព័រផ្ទាល់ខ្លួនដើម្បីទទួលបានព័ត៌មាន។ ទីពីរគឺជួយអ្នកដទៃដែលអាចស្វែងរកព័ត៌មានផងដែរ។
តើអ្វីទៅជាកន្សោមធម្មតា (Regex)?
Regex គឺជាវិធីសាស្ត្រអភិវឌ្ឍន៍ដើម្បីស្វែងរកនិងកំណត់លំនាំនៃតួអក្សរនៅក្នុងអត្ថបទដើម្បីផ្គូរផ្គងរឺជំនួសអត្ថបទ។ ភាសាសរសេរកម្មវិធីទំនើបទាំងអស់គាំទ្រដល់កន្សោមធម្មតា។
ខ្ញុំចូលចិត្តកន្សោមធម្មតា (regex) ប៉ុន្តែពួកគេអាចធ្វើឱ្យមានអារម្មណ៍ធុញទ្រាន់ឬខឹងក្នុងការរៀននិងសាកល្បង។ ការវិភាគរបស់ហ្គូហ្គោលមានសមត្ថភាពអស្ចារ្យមួយចំនួនដែលអ្នកអាចបង្កើតទស្សនៈដោយប្រើកន្សោមធម្មតាឬច្រោះទិន្នន័យរបស់អ្នកតាមកន្សោមធម្មតា។
ឧទាហរណ៍ប្រសិនបើខ្ញុំចង់ឃើញចរាចរណ៍នៅលើទំព័រស្លាករបស់ខ្ញុំខ្ញុំអាចត្រងសម្រាប់ / ស្លាក / នៅក្នុងរចនាសម្ព័ន្ធ permalink របស់ខ្ញុំដោយប្រើ៖
/tag\/
វាក្យសម្ព័ន្ធគឺមានសារៈសំខាន់នៅទីនោះ។ ប្រសិនបើខ្ញុំទើបតែប្រើ“ ស្លាក” ខ្ញុំនឹងទទួលបានទំព័រទាំងអស់ដែលមានពាក្យដែលមាននៅក្នុងពាក្យនោះ។ ប្រសិនបើខ្ញុំប្រើ“ / tag” ពេលនោះ URL ណាមួយដែលចាប់ផ្តើមជាមួយ tag នឹងត្រូវរាប់បញ្ចូលដូចជា / ស្លាកគ្រប់គ្រង ពីព្រោះ Google Analytics មិនរាប់បញ្ចូលតួអក្សរណាមួយបន្ទាប់ពីកន្សោមធម្មតា។ ដូច្នេះខ្ញុំត្រូវធានាថាខ្ញុំមានសញ្ញាដកដូចខាងក្រោម ... ប៉ុន្តែវាត្រូវតែមានតួអក្សរគេចចេញពីវា។
មូលដ្ឋានគ្រឹះវចនានុក្រម Regex
វាក្យសម្ពន្ធ | ការពិពណ៌នា |
^ | ចាប់ផ្តើមជាមួយ |
$ | បញ្ចប់ជាមួយ |
. | តួអក្សរជំនួសសម្រាប់តួអក្សរណាមួយ |
* | សូន្យឬច្រើនជាងនេះនៃធាតុមុន |
.* | ផ្គូផ្គងតួអក្សរណាមួយនៅក្នុង |
? | សូន្យឬមួយពេលនៃធាតុមុន |
+ | មួយដងឬច្រើនដងនៃធាតុមុន |
| | ប្រតិបត្តិករ OR |
[abc] | A ឬ b ឬ c (អាចជាចំនួនតួអក្សរ) |
[az] | ជួរនៃ a ដល់ z (អាចជាចំនួនតួអក្សរ) |
[អាហ្សា] | ជួរពី A ដល់ Z (សរសេរជាអក្សរធំ) |
[0-9] | ជួរពី ០ ដល់ ៩ (អាចជាលេខណាមួយ) |
[a-zA-Z] | ជួរពី A ដល់ Z ឬ A ដល់ Z |
[a-zA-Z0-9] | តួអក្សរអក្ខរក្រមទាំងអស់ |
{១១២០} | ឧទាហរណ៍ ១ យ៉ាង (អាចជាលេខណាមួយ) |
{១-៤} | ជួរពី ១ ទៅ ៤ ករណី (អាចជាលេខណាមួយ) |
{១,} | ឧទាហរណ៍ ១ ឬច្រើន (អាចជាលេខណាមួយ) |
() | ដាក់ក្រុមរបស់អ្នកជាក្រុម |
\ | គេចចេញពីតួអក្សរពិសេស |
\d | តួរលេខខ្ទង់ |
\D | តួអក្សរមិនមែនខ្ទង់ |
\s | ចន្លោះពណ៌ស |
\S | ទំហំមិនស |
\w | ព្រះបន្ទូល |
\W | មិនមែនពាក្យ (វណ្ណយុត្តិ) |
ឧទាហរណ៍ Regex សំរាប់ Google Analytics
ដូច្នេះសូមដាក់ឧទាហរណ៍ខ្លះនៅទីនោះសម្រាប់ឧទាហរណ៍ខ្លះ តម្រងផ្ទាល់ខ្លួន. សហសេវិករបស់ខ្ញុំម្នាក់បានសុំជំនួយក្នុងការកំណត់អត្តសញ្ញាណទំព័រផ្ទៃក្នុងជាមួយនឹងផ្លូវនៃ / សន្ទស្សន៍ បន្ថែមលើការដាក់ប្រកាសប្លក់ទាំងអស់ដែលត្រូវបានសរសេរជាមួយឆ្នាំនៅក្នុងអ៊ីនធឺណិត៖
លំនាំត្រងផ្ទាល់ខ្លួនរបស់ខ្ញុំសំរាប់វាលចម្រោះសូមស្នើសុំវែបៈ
^/(index|[0-9]{4}\/)
នោះបញ្ជាក់ជាមូលដ្ឋានដើម្បីរកមើល / លិបិក្រមឬលេខលេខ ៤ ខ្ទង់ណាមួយដែលបញ្ចប់ដោយសញ្ញា (-) ។ ខ្ញុំបានបង្កើតទិដ្ឋភាពនៅក្នុងការវិភាគហើយបន្ថែមនេះជាតម្រង៖
នេះគឺជាឧទាហរណ៍មួយចំនួនទៀត៖
- អ្នកមានប្លក់ជាមួយឆ្នាំនៅក្នុងផ្លូវ URL permalink ហើយអ្នកចង់ត្រងបញ្ជីទៅឆ្នាំណាមួយ។ ដូច្នេះខ្ញុំចង់បានលេខ ៤ ខ្ទង់អមដោយសញ្ញា (-) ។ ស្នើសុំលំនាំតម្រងយូអ៊ែល:
^/[0-9]{4}\/
- អ្នកចង់ប្រៀបធៀបទំព័រទាំងអស់របស់អ្នកដែលចំណងជើងមាន វិញ្ញាបនបត្រ or វិញ្ញាបនប័ត្រ នៅក្នុងវា។ លំនាំត្រងចំណងជើងទំព័រ:
(.*)certificat(.*)
- អ្នកចង់ប្រៀបធៀបទំព័រចុះចតចំនួនពីរដែលមានមូលដ្ឋានលើយុទ្ធនាការឃោសនាបោះឆ្នោតរបស់ពួកគេដែលបានដាក់ចូល URL យុទ្ធនាការ Google វិភាគ ជា utm_medium = ផ្ញើអ៊ីមែលដោយផ្ទាល់ or ការស្វែងរកដែលបានបង់.
(direct\smail|paid\ssearch)
- អ្នកចង់ប្រៀបធៀបផលិតផលទាំងអស់ដែលជាអាវបុរសដោយផ្អែកលើផ្លូវ URL ។ ស្នើសុំលំនាំតម្រងយូអ៊ែល:
^/mens/shirt/(.*)
- អ្នកចង់ប្រៀបធៀបទំព័រទាំងអស់ដែលមានលេខផ្លូវ URL ដែលបញ្ចប់ដោយលេខ។ ស្នើសុំលំនាំតម្រងយូអ៊ែល:
^/page/[1-9]*/$
- អ្នកចង់ដកអាសយដ្ឋាន IP ជាច្រើន។ មិនរាប់បញ្ចូលលំនាំតម្រងអាសយដ្ឋាន IP:
123\.456\.789\.[0-9]
- អ្នកចង់បញ្ចូលទំព័រ thankyou.html ដែលការដាក់ស្នើបានជោគជ័យដោយផ្អែកលើសំណួរជោគជ័យ = ពិត។ ស្នើសុំលំនាំតម្រងយូអ៊ែល:
thankyou\.html\?success=true
វិធីសាកល្បងកន្សោម Regex របស់អ្នក
ជាជាងការសាកល្បងនិងកំហុសនៅក្នុង Google Analytics ខ្ញុំតែងតែលោតទៅ regex 101ដែលជាឧបករណ៍ដ៏អស្ចារ្យមួយសម្រាប់ការសាកល្បងកន្សោមធម្មតារបស់អ្នក។ វាថែមទាំងបំលែងវាក្យសម្ព័ន្ធរបស់អ្នកសម្រាប់អ្នកនិងផ្តល់ព័ត៌មានលម្អិតនៃកន្សោមធម្មតារបស់អ្នក៖