Как сопоставить японские символы с помощью регулярного выражения IDN?

На основе этого сообщения текст ссылки

я придумал регулярное выражение для javascript

\b(([\w-]+:\/\/?|[\w\d]+[.])?[^\s()<>]+[.](?:\([\w\d]+\)|([^`!()\[\]{};:'".,<>?«»“”‘’\s]|\/)))

этот соответствует таким URL-адресам, как

  • http://google.com
  • http://www.google.com
  • google.com

Это не удается для google, но когда я использовал японские символы, такие как 功功.jp, это не удается.

  • www.功功.jp
  • http://www.功功.jp
  • http://功功.jp

Эти совпадают. Что нужно изменить, чтобы 功功.jp тоже совпало.


person anusuya    schedule 16.07.2010    source источник


Ответы (1)


Очень небольшая модификация, сделанная здесь, работает для меня:

/(([\w-]+:\/\/?|[\w\d]+[.])?[^\s()<>]+[.](?:\([\w\d]+\)|([^`!()\[\]{};:'\".,<>?«»“”‘’\s]|\/)+))/
person Jeffrey Blake    schedule 23.07.2010