我如何使用提取跟踪自定义维度的动作数据?
的关键特征之一自定义尺寸是跟踪与页面视图等操作相关联的自定义数据的能力。这通常要求您向站点添加自定义代码或使用标签管理器.然而,也可以直接从页面的URL,页面参数或页面标题在Matomo内置程序的帮助下提取特性。
每个站点都是独一无二的,因此您选择关注的自定义维度和值可能会有所不同。此外,根据站点的配置方式,可能会有不同的方法来收集相同的信息。在本页上,您将找到关于如何设置每种类型的提取的一般说明,以及何时以及如何使用某种类型的提取的示例。
重要的是要记住,提取只能用于动作范围的自定义维度。你可以在自定义维度指南中了解有关作用域的更多信息.
如何为自定义维度数据设置提取
的配置页面上设置提取自定义尺寸它们与。控件可以找到自定义尺寸齿轮图标 在顶部蓝色的菜单中。一旦到了那里,找到网站或可衡量的链接(名称根据您的Matomo版本而异)在左侧的主导航中,然后单击自定义尺寸链接。
在自定义维度页面上,滚动到行动维度部分。接下来,单击绿色大按钮创建一个新维度,或者单击编辑图标 配置已存在的。
类下可以找到创建和管理提取的相关设置提取价值标题。
您接下来的步骤将略有不同,这取决于您需要的提取类型。
Matomo如何使用RegEx提取值
方法配置提取时页面的URL而且页面标题,您将需要使用RegEx搜索模式。学习所有的RegEx变量超出了本文的范围。但是,它与Matomo的Custom Dimensions一起使用的一个独特的重要方面是,括号中的第一个表达式将提取要针对维度设置的值。下面举几个例子:
页面ID via的自定义维度页面的URL
- 网址路径:
/新闻/ 780546 / new-nightvision-camera /
- 正则表达式搜索模式:
/ /新闻/(. *)。* /
- 提取结果:
780546
自定义维度的作者页面通过页面标题
- 网页标题:
作者:Jane Doe
- 正则表达式搜索模式:
发帖人(.*)
- 提取结果:
简母鹿
附注:在某些情况下,您需要使模式用于匹配懒惰的(例如贪婪)。这是通过添加?
后*
在捕获组中。例如:/新闻 /(.*?)/.*/
如果你不熟悉正则表达式,我们强烈推荐你学习正则表达式在使用它之前,一定要记住测试你的RegEx模式广泛。
开发人员注意:你不需要逃避向前斜杠,因为Matomo自动为你做这件事。如使用/新闻/
而不是\ \ / /消息
页面URL抽取示例
要在Page URL上使用Extraction特性,需要在URL内访问计划跟踪的数据。URL提取的一个示例用例是在多语言网站上跟踪访问的语言。在下面的URL结构中,为英文的语言代码在
是明确定义的:
https://example.com/lang-en/plugin/
在上面的URL中,第一部分包含域https://example.com/
.这一节之后是语言朗-
设置为在
代表两个字母语言代码为英语。最后是路径的剩余部分/插件/
是某人正在查看的特定页面。遵循相同的结构,法语的等效页面将具有以下URL:
https://example.com/lang-fr/plugin/
由于这些页面共享一个公共结构,因此可以使用针对语言代码的RegEx(正则表达式)模式安全地提取语言代码。对于上面的示例URL结构,您可以使用RegEx模式/ lang - (. *) / * /
捕获语言代码,如下面的截图所示:
上面的正则表达式查找首字母/ lang -
URL中的前缀,然后是分组通配符(.*)
提取要与自定义维度关联的语言代码。最后,中间有两个斜杠和一个通配符/ . * /
以确保RegEx模式捕获每个带有语言前缀的页面。
一旦创建了这个自定义维度,就可以通过访问具有相同URL结构的任何页面来测试它。要确认数据被正确跟踪,您应该转到访问日志,找到您的特定访问,并将鼠标悬停在URL上查看任何相关的自定义维度。在下面的截图中,您可以看到页面的语言Dimension已被设置为等于在.
这只是使用正则表达式模式的一个例子。可以根据特定的URL结构创建相当高级的模式。下面的Page Title部分中还有另一个使用RegEx的例子。
页面标题抽取示例
虽然每页的页面标题通常是唯一的,但它们通常有部分相似之处。例如,你可以用这个词博客
对于每一篇博文或者会员区
对于你网站的会员部分。考虑以下两篇博客文章的页面标题示例:
- 新智能手机为你煮咖啡-科技文章
- 《为什么你需要使用分析-营销文章》
虽然每篇文章的前半部分似乎都有变化,但标题的第二部分有一个明确的模式,包括博客文章所在的类别,例如技术或营销。如果这个模式在整个站点中是一致的,那么您可以设计一个RegEx模式来提取博客文章类别。在这种情况下,你可以使用下面的模式:
. * \ s (. *) \ sArticles
分解上面模式中的各个组件.*
匹配任意数量的任意字符,直到- - - - - -
开始寻找冠军的突破口。接下来,\ s
表示空格字符,以避免自定义维度值中出现不必要的空格。然后是分组通配符(.*)
在最后一个空格字符之前选择实际的类别文本\ s
而且文章
关闭模式。因此,从上面的RegEx示例中提取的值将是下面粗体显示的单词:
- “新款智能手机让你喝咖啡”科技文章”
- 《为什么你需要使用分析》市场营销文章”
为了测试这是工作,你可以访问任何页面匹配你的模式,然后找到你的页面视图访问日志.如果你遵循上面的例子,当你将鼠标悬停在页面视图上时,你会看到以下内容:
页面参数提取示例
页面参数是显示在URL末尾的元素。由于各种原因,它们通常包含任意数据,其中一些可能需要为其设置自定义维度。URL中的第一个参数前面是?
下面的任何参数都用a隔开&
.
例如,一些附属程序(人们将流量引用到站点进行支付)通过查询参数跟踪推荐。这看起来有点像下面的URL裁判
查询参数,和下属
为参数值:
https://example.com/plugin/?ref=affiliate
如果您正在以这种方式运行一个联属项目,那么创建一个自定义维度来跟踪哪些页面视图被联属引用,以及哪些联属带来了最多的流量可能会很有用。
参数比Page url更容易配置,因为它们不需要RegEx。相反,您只需要指定应该跟踪的参数。
设置了匹配后,可以通过访问包含页面参数的URL,然后在访问日志.按照上面的例子,当你将鼠标悬停在页面视图上时,你会看到以下内容:
更多的资源
关于如何报告和分析这些值,您可以在完整的自定义尺寸指南.