如何使用ABAP正则表达式解析HTML标签-创新互联

小编给大家分享一下如何使用ABAP正则表达式解析HTML标签,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

成都创新互联坚持“要么做到,要么别承诺”的工作理念,服务领域包括:网站建设、成都网站设计、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的东昌网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!

需求就是我用ABAP的某个函数从数据库读取一个字符串出来,该字符串的内容是一个网页。

网页的form里包含了很多隐藏的input field。我的任务是解析出name为svyValueGuid的input field的值:FA163EEF573D1ED89E89C7FE5E7C4715

如何使用ABAP正则表达式解析HTML标签

最简单粗暴的做法是:利用ABAP的FIND FIRST OCCURRENCE关键字首先找到svyValueGuid的偏移量,然后从这个偏移量出发,再找到第一个>的偏移量,这样问题就化简为在子串type="hidden" value="FA163EEF573D1ED89E89C7FE5E7C4715",这样问题就简单多了。但是这种办法比较笨重,代码很冗余。

有没有更快捷的办法呢?那就是使用ABAP regular expression,即正则表达式。

请看下列的测试代码:

REPORT ztest_interface.
DATA: lv_input TYPE string,
reg_pattern TYPE string.
lv_input = `` &&
`Jerry's Programming Skill survey
` && `` && `` && `` && `` && `` && ``. reg_pattern = '.*svyValueGuid(?:.*)value="(.*)">.*SurveyId.*'. TRY. DATA(lo_regex) = NEW cl_abap_regex( pattern = reg_pattern ). DATA(lo_matcher) = lo_regex->create_matcher( EXPORTING text = lv_input ). IF lo_matcher->match( ) <> abap_true. WRITE:/ 'fail in input scan!'. RETURN. ENDIF. DATA(lt_reg_match_result) = lo_matcher->find_all( ). READ TABLE lt_reg_match_result ASSIGNING FIELD-SYMBOL() INDEX 1. READ TABLE -submatches ASSIGNING FIELD-SYMBOL() INDEX 1. data(lv_sub) = lv_input+-offset(-length). WRITE:/ 'result: ', lv_sub. CATCH cx_root INTO DATA(cx_root). WRITE:/ cx_root->get_text( ). RETURN. ENDTRY.

执行结果:

如何使用ABAP正则表达式解析HTML标签

解决问题的核心思路是这个正则表达式:.svyValueGuid(?:.)value="(.)">.SurveyId.***

通过捕获分组操作符,一对小括号,将32位的GUID值进行捕获。这种解法比FIND FIRST OCCURANCE的代码量要少。

看完了这篇文章,相信你对“如何使用ABAP正则表达式解析HTML标签”有了一定的了解,如果想了解更多相关知识,欢迎关注创新互联-成都网站建设公司行业资讯频道,感谢各位的阅读!


分享题目:如何使用ABAP正则表达式解析HTML标签-创新互联
URL标题:http://scyanting.com/article/ddphco.html

其他资讯